<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>刺客 &#187; CMS</title>
	<atom:link href="http://blog.cike.org/tag/cms/feed/" rel="self" type="application/rss+xml" />
	<link>http://blog.cike.org</link>
	<description>刘益民中文网</description>
	<lastBuildDate>Mon, 03 May 2010 06:23:27 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.9.2</generator>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>dede5.1升5.3程序完毕</title>
		<link>http://blog.cike.org/2009/dedecms51-tupdate-to53/</link>
		<comments>http://blog.cike.org/2009/dedecms51-tupdate-to53/#comments</comments>
		<pubDate>Sun, 24 May 2009 22:55:57 +0000</pubDate>
		<dc:creator>cike</dc:creator>
				<category><![CDATA[1984]]></category>
		<category><![CDATA[CMS]]></category>
		<category><![CDATA[php]]></category>
		<category><![CDATA[Sql]]></category>
		<category><![CDATA[升级]]></category>

		<guid isPermaLink="false">http://blog.cike.org/?p=409</guid>
		<description><![CDATA[反复折腾多次总算把杨树网（www.yangshu.org）升级完成，问题主要出在分类信息、问答，官方升级说明中也强调了这两个是不能兼容新版本的]]></description>
			<content:encoded><![CDATA[<p>反复折腾多次总算把<a href="http://www.yangshu.org" target="_blank">杨树网</a>（www.yangshu.org）升级完成，问题主要出在分类信息、问答，官方升级说明中也强调了这两个是不能兼容新版本的</p>
<p>我的升级历程：</p>
<ol>
<li>第一次长级完发现问答数据丢失</li>
<li>重新运行升级程序，文章数据也丢失</li>
<li>回档到5.1</li>
<li>数据库升级过程闪显红色错误，没在意跳过</li>
<li>测试发布信息，出现“<span style="color: #000000;">把数据保存到数据库附加表 `dede_addoninfos` 时出错……</span>”</li>
<li>本地安装完整dedecms5.3，对比表dede_addoninfos，索引键值等一切相同，这个表没问题，那就是数据有问题了</li>
<li>回档到5.1，这次<span style="color: #ff0000;">做一点备份一点，回档是个力气活，很枯燥</span></li>
<li>重回第四步，本次开了QQ准备好了&#8221;Ctrl+Alt+A&#8221;，顺便截住数据库升级过程中的一次报错（约1秒后会消失，升级最终不会报错，所以<span style="color: #ff0000;">每一次页面涮新都要盯好不能只看最后的升级成功页面提示</span>）提示“insert dede_arctiny(……”</li>
<li>查dede_arctiny表，发现没这个dede_arctin，大喜，从5.3默认库中导出SQL，回到新升级的库发现有dede_arctiny表（第一次看错库了，开了三个数据库界面5.3默认的、5.1老数据、刚升级后的数据，把5.1老的当成刚升级完的- -！），查表新库中的dede_arctiny，有数据但条数不对，那问题就出在某一条记录上，操作SQL最终排查到dede_addoninfos中aid=0这条记录无法被导入，强删，再导</li>
<li>成功，余下就是二次开发和升级模板的事了</li>
</ol>
<p>心得是什么，看上面的红色字块</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.cike.org/2009/dedecms51-tupdate-to53/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>万博企业网站管理系统2006多语版SEO致命缺陷评测</title>
		<link>http://blog.cike.org/2007/wanbo-cms-seo/</link>
		<comments>http://blog.cike.org/2007/wanbo-cms-seo/#comments</comments>
		<pubDate>Fri, 25 May 2007 01:58:48 +0000</pubDate>
		<dc:creator>cike</dc:creator>
				<category><![CDATA[SEO\SEM]]></category>
		<category><![CDATA[CMS]]></category>
		<category><![CDATA[SEO]]></category>
		<category><![CDATA[测评]]></category>

		<guid isPermaLink="false">http://temp.cike.org/2007/05/%e4%b8%87%e5%8d%9a%e4%bc%81%e4%b8%9a%e7%bd%91%e7%ab%99%e7%ae%a1%e7%90%86%e7%b3%bb%e7%bb%9f2006%e5%a4%9a%e8%af%ad%e7%89%88seo%e8%87%b4%e5%91%bd%e7%bc%ba%e9%99%b7%e8%af%84%e6%b5%8b/</guid>
		<description><![CDATA[对SEO了解的朋友可能都会听过这一种说法，复制网页会被搜索引擎当作作B处理，降权，严重的直接被K<br/>有这样的事例的！只因老版的网站没删除，新版的内容完全一样，结果让搜索引荐除名了，自己去查查，我忘了网址了<br/>如果你用了三语版，等于一个域名下存在两份网页复制，共三个完全相同的网站<br/>]]></description>
			<content:encoded><![CDATA[<p>昨天AO夜改了<strong>万博2006多语版</strong>，查看了简繁英三语切换的代码，预计到一个致命缺陷</p>
<h3>艰难取证：</h3>
<p><strong>1.查找使用 万博2006多语版的企业网站</strong></p>
<p><a href="http://www.google.com/">google</a>中搜索<a href="http://www.google.cn/search?complete=1&amp;hl=zh-CN&amp;q=inurl%3ALanguage%2FSelect.asp%3FLanguage%3DEnglish&amp;meta=">inurl:Language/Select.asp?Language=English</a> 很快找到了很多用了<strong>万博2006多语版</strong>的企业网站</p>
<p> <img src="http://blog.cike.org/upload/1.jpg" alt="" /> 我挑选了<a href="http://www.yuanchengtech.com">www.yuanchengtech.com</a>验证他的英文版</p>
<p><img src="http://blog.cike.org/upload/200705251010148670.jpg" alt="" /></p>
<p>显然这是英文版，显示的也是英文，我们访问是没问题</p>
<p><strong>2. 模拟抓取工具验证一下能不能被抓到多语呢?</strong></p>
<p> <img src="http://blog.cike.org/upload/200705251015080687.gif" alt="" /></p>
<p>乱码先不管，至少说明是中文的<img src="/zblog/admin/FCKeditor/editor/images/smiley/msn/cry_smile.gif" alt="" /></p>
<p><strong>3. 百度一下+GG一下再次验证</strong></p>
<p> <img src="http://blog.cike.org/upload/wb2006_4.gif" alt="" /></p>
<p> <img src="http://blog.cike.org/upload/wb2006_5.gif" alt="" /></p>
<p> 没错，在搜索引荐看来，万博只是单语版+三个网站复制</p>
<h3>恶果</h3>
<p>对SEO了解的朋友可能都会听过这一种说法，复制网页会被搜索引擎当作作B处理，降权，严重的直接被K</p>
<p>有这样的事例的！只因老版的网站没删除，新版的内容完全一样，结果让搜索引荐除名了，自己去查查，我忘了网址了</p>
<p>如果你用了三语版，等于一个域名下存在两份网页复制，共三个完全相同的网站</p>
<p>可能你排名很差，你被收录的很少，恭喜你，你逃过了</p>
<p>你排名好，收录多，可能就快完了</p>
<h3>原因</h3>
<p>万博多语版不同语言间的切换是通过cookies实现的，第二次访问会出现不同语言混乱不说\Language\select.asp</p>
<p><span class="Code">&lt;%<br />
dim Language<br />
Language=request.queryString(&#8220;Language&#8221;)<br />
select case Language<br />
  case &#8220;Simplified&#8221;<br />
    response.cookies(&#8220;Language&#8221;)=&#8221;Simplified&#8221;<br />
  case &#8220;Traditional&#8221;<br />
   response.cookies(&#8220;Language&#8221;)=&#8221;Traditional&#8221;<br />
  case &#8220;English&#8221;<br />
    response.cookies(&#8220;Language&#8221;)=&#8221;English&#8221;<br />
  case else<br />
    response.cookies(&#8220;Language&#8221;)=&#8221;Simplified&#8221;<br />
end select<br />
response.cookies(&#8220;Language&#8221;).expires = DateAdd(&#8220;m&#8221;,1,now)<br />
response.write &#8220;&lt;script&gt;window.location.href(&#8216;../&#8221;&amp;request.cookies(&#8220;Language&#8221;)&amp;&#8221;/Main.asp&#8217;);&lt;/script&gt;&#8221;<br />
%&gt;</span></p>
<p> 搜索引荐是不会把COOKIES写到自己服务器上再来抓取你的</p>
<h3>补救</h3>
<p>今天早上迟到了，时间不多，仅给出思路，要不明白的朋友加3512794技术交流</p>
<p>因为系统分了三个目录</p>
<p>Traditional 繁体</p>
<p>english 英文</p>
<p>Simplified 简体</p>
<p>这已经很清楚地标出了不同语言，再用cookies判断就多余，而且存在一个BUG：</p>
<p>繁体、英文二语与简体之间的混乱，第一访问若是简体，你的本机COOKIES值为“Simplified”第二次访问，直接输入英文地址看会出现什么？</p>
<p>改法就是把SQL语句全部用常量</p>
<p>如原simplified/main.asp有</p>
<p> <span class="Code">sql=&#8221;select ID,ProductName&#8221;&amp;LangData&amp;&#8221;,SortID,SmallPic,GroupID,Exclusive from NwebCn_Products where ViewFlag&#8221;&amp;LangData&amp;&#8221; and CommendFlag order by id desc&#8221;</span></p>
<p>现在改成</p>
<p><span class="Code"> sql=&#8221;select ID,ProductNameSI,SortID,SmallPic,GroupID,Exclusive from NwebCn_Products where ViewFlagSi and CommendFlag order by id desc&#8221;</p>
<p> </p>
<p></span></p>
]]></content:encoded>
			<wfw:commentRss>http://blog.cike.org/2007/wanbo-cms-seo/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>网站防采集策略之生成静态页面篇</title>
		<link>http://blog.cike.org/2007/anti-caiji/</link>
		<comments>http://blog.cike.org/2007/anti-caiji/#comments</comments>
		<pubDate>Wed, 02 May 2007 02:02:17 +0000</pubDate>
		<dc:creator>cike</dc:creator>
				<category><![CDATA[前端]]></category>
		<category><![CDATA[CMS]]></category>
		<category><![CDATA[采集]]></category>
		<category><![CDATA[静态]]></category>

		<guid isPermaLink="false">http://temp.cike.org/2007/05/%e7%bd%91%e7%ab%99%e9%98%b2%e9%87%87%e9%9b%86%e7%ad%96%e7%95%a5%e4%b9%8b%e7%94%9f%e6%88%90%e9%9d%99%e6%80%81%e9%a1%b5%e9%9d%a2%e7%af%87/</guid>
		<description><![CDATA[大部分采集器都是靠分析分页文件名规则，进行批量、多页采集的。如果别人找不出你的分页文件的文件名规则，那么别人就无法对你的网站进行批量多页采集]]></description>
			<content:encoded><![CDATA[<p>从前面的我讲的asp采集原理大家可以看出，绝大多数采集程序都是靠分析规则来进行采集的，如分析分页文件名规则、分析页面代码规则。</p>
<p><strong>一、分页文件名规则防采集对策</strong></p>
<p>大部分采集器都是靠分析分页文件名规则，进行批量、多页采集的。如果别人找不出你的分页文件的文件名规则，那么别人就无法对你的网站进行批量多页采集。</p>
<p>实现方法：</p>
<p>我认为用MD5加密分页文件名是一个比较好的方法，说到这里，有人会说，你用MD5加密分页文件名，别人根据此规则也可以模拟你的加密规则得到你的分页文件名。</p>
<p>我要指出的是我们加密分页文件名时，不要只加密文件名变化的部分</p>
<p>如果I代表分页的页码，那么我们不要这样加密：page_name=Md5(I,16)&amp;&#8221;.htm&#8221;</p>
<p>最好给要加密的页码上再跟进一个或多个字符，如：page_name=Md5(I&amp;&#8221;任意一个或几个字母&#8221;,16)&amp;&#8221;.htm&#8221;</p>
<p>因为MD5是无法反解密的，别人看到的会页字母是MD5加密后的结果，所以加人也无法知道你在 I 后面跟进的字母是什么，除非他用暴力****MD5，不过不太现实。</p>
<p><strong>二、页面代码规则防采集对策</strong></p>
<p>如果说我们的内容页面无代码规则，那么别人就无法从你的代码中提取他们所需要的一条条内容。所以我们要的这一步做到防采集，就要使代码无规则。</p>
<p>实现方法：</p>
<p>使对方需要提取的标记随机化</p>
<p>1、定制多个网页模板，每个网页模板里的重要HTML标记不同，呈现页面内容时，随机选取网页模板，有的页面用CSS+DIV布局，有的页面用table布局，此方法是麻烦了点，一个内容页面，要多做几个模板页面，不过防采集本身就是一件很烦琐的事情，多做一个模板，能起到防采集的作用，对很多人来说，都是值得的。<br />
2、如果嫌上面的方法太麻烦，把网页里的重要HTML标记随机化，也可以。</p>
<p>做的网页模板越多，html代码越是随机化，对方分析起内容代码时，就越麻烦，对方针对你的网站专门写采集策略时，难度就更大，在这个时候，绝大部分人，都会知难而退，因为这此人就是因为懒，才会采集别人网站数据嘛~~~再说一下，目前大部分人都是拿别人开发的采集程序去采集数据，自己开发采集程序去采集数据的人毕竟是少数。</p>
<p>还有些简单的思路提供给大家：</p>
<p>1、把对数据采集者重要，而对搜索引擎不重要的内容用客户端脚本显示<br />
2、把一页数据，分为N个页面显示，也是加大采集难度的方法<br />
3、用更深层的连接，因为目前大部分采集程序只能采集到网站内容的前3层，如果内容所在的连接层更深，也可以避免被采集。不过这样可能会给客户造成浏览上的不便。如：</p>
<p>大多网站都是 首页&#8212;-内容索引分页&#8212;-内容页<br />
如果改成：<br />
首页&#8212;-内容索引分页&#8212;-内容页入口&#8212;-内容页<br />
注：内容页入口最好能加上自动转入内容页的代码:</p>
<p>&lt;meta http-equiv=&#8221;refresh&#8221; content=&#8221;6;url=内容页(<a href="http://yangshu.org">http://yangshu.org</a>)</p>
<p>其实，只要做好防采集的第一步(加密分页文件名规则)，防采集的效果就已经不错了，还是建议两条反采集方法同时使用，给采集者增加采集难度，使得他们知难页退。</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.cike.org/2007/anti-caiji/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>保住成果-网站改版总结</title>
		<link>http://blog.cike.org/2007/site-change/</link>
		<comments>http://blog.cike.org/2007/site-change/#comments</comments>
		<pubDate>Thu, 25 Jan 2007 01:22:15 +0000</pubDate>
		<dc:creator>cike</dc:creator>
				<category><![CDATA[SEO\SEM]]></category>
		<category><![CDATA[前端]]></category>
		<category><![CDATA[CMS]]></category>
		<category><![CDATA[SEO
搜索优化]]></category>
		<category><![CDATA[改版]]></category>
		<category><![CDATA[流量]]></category>

		<guid isPermaLink="false">http://temp.cike.org/2007/01/%e4%bf%9d%e6%8c%81%e7%bd%91%e7%ab%99%e6%b5%81%e9%87%8f%e5%af%b9%e7%bd%91%e7%ab%99%e6%94%b9%e7%89%88%e6%96%b9%e6%a1%88%e5%bb%ba%e8%ae%ae%e7%af%87/</guid>
		<description><![CDATA[根据刺客从06到09年间参与实现几次大的网站改版，主要经验来自包括中国杨树网、中国数控机床、519R.com在内的几次改版、还包括本博客，总结一下你可以借鉴的地方。]]></description>
			<content:encoded><![CDATA[<p>网站的改版（本文的改版不包括页面美工的调整）多半由非技术层发起，更多注重表现层的内容或架构，可以说发起人很少去哪些取舍会更给网站带来更小的负面影响！</p>
<p>根据刺客从06到09年间参与实现几次大的网站改版，主要经验来自包括中国杨树网、中国数控机床、519R.com在内的几次改版、还包括本博客，总结一下你可以借鉴的地方。</p>
<h3>如何面对搜索引擎？</h3>
<p><strong>你打算更换域名？<br />
</strong>301重定向是必须的，你得有心理准备，百度对301的过度周期很漫长，甚至还会有偶尔的反复，刺客理解为百度这段期间在怀疑中考查你的网站在做什么，怕你把流量导入垃圾站？我也不知道</p>
<p><strong>更换原页面的URL？<br />
</strong>如果可能，不要这么做，换域名你可以在服务端几行代码实现，如果是大量URL风格各异，你的修改体力成本会很高，本人的博客原使用zblog，切换到wordpress后，测试多次.htaccess才将大部分文章URL正确重定向至此，终极页排名还是明显下滑，现在想起来，好点办法是分批修改</p>
<p>还有一种可能，你原文章是大量的静态页，这下好了，保留静态页不要管他，从首页开始引入新的URL链接，新旧并存，你还要在旧页面给个友好提示，告诉用户您在浏览的是过时的页面，你可以从某某处访问最新内容。我推荐这一种。我唯一担心的是会不会给SE带来内容复制的错觉？</p>
<p>这仅是参考，具体考虑因素有很多，比如519R二手频道我将在4月底从ASP过度到PHP，前天或更早的二手信息对用户是接近无意义的，从统计上看绝大部分用户访问入口是从频道首页，我的改版就规划就简单了，转换ASP的48小时数据到PHP版，然后直接换成PHP版，ASP您再也看不到，没有301</p>
<h3>如何面对用户？</h3>
<p>正式上线前，小范围的测试可以提供给你很多的改进灵感，绝不应在正式上线后再反复修改。</p>
<p>友好地提供旧的访问入口将很受欢迎，用户习惯要有过度期。</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.cike.org/2007/site-change/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
