<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>刺客 &#187; 隐私</title>
	<atom:link href="http://blog.cike.org/tag/%e9%9a%90%e7%a7%81/feed/" rel="self" type="application/rss+xml" />
	<link>http://blog.cike.org</link>
	<description>刘益民中文网</description>
	<lastBuildDate>Mon, 03 May 2010 06:23:27 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.9.2</generator>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>网页识别性别-我很MAN，网易鉴定</title>
		<link>http://blog.cike.org/2009/sexm-atch-by-web/</link>
		<comments>http://blog.cike.org/2009/sexm-atch-by-web/#comments</comments>
		<pubDate>Wed, 29 Apr 2009 10:42:25 +0000</pubDate>
		<dc:creator>cike</dc:creator>
				<category><![CDATA[1984]]></category>
		<category><![CDATA[人肉]]></category>
		<category><![CDATA[挖掘]]></category>
		<category><![CDATA[行为]]></category>
		<category><![CDATA[隐私]]></category>

		<guid isPermaLink="false">http://blog.cike.org/?p=404</guid>
		<description><![CDATA[猜测网页判断性别流程：提交关键词-》特征库比对-》得出结论]]></description>
			<content:encoded><![CDATA[<p><img class="alignnone size-full wp-image-405" title="youdao-mathsex" src="http://blog.cike.org/wp-content/uploads/2009/05/youdao-mathsex.png" alt="youdao-mathsex" width="267" height="113" /><br />
这里查看：<a href="http://www.yodao.com/blogender/result2.jsp?keyfrom=blogender.help&amp;url=http%3A%2F%2Fcike.org">http://www.yodao.com/blogender/result2.jsp?keyfrom=blogender.help&amp;url=http%3A%2F%2Fcike.org</a></p>
<p>测试发现，有道是挖掘数据来自你的RSS，没有RSS接口就会报错</p>
<p><strong>为什么要挖掘RSS</strong></p>
<p>XML数据优点不用多说，还有一个重要点RSS一般不会包括评论的内容，试想HEBI的博客有多少GG在留言评论，大量明显男性化的评论，可以把整站彻底男性化，如此这个鉴定就没意义了</p>
<p><strong>猜测判断性别流程</strong>：提交关键词-》特征库比对-》得出结论</p>
<p>如MM爱写嘻嘻、呵呵、555555，减肥、美白、逛街……一些MM专用品牌名都可以作为依据，判断精准度很大部分依赖这个知识设计者于对用户行为、习惯的经验积累，设计者未知晓的领域就定为半男半女吧，随机测试了几个英文网志，都是55分，半男半女</p>
<p><strong>还可以判断更多</strong></p>
<p>性别可以，年龄、职业也应可以，流程一样，不同仅在特征库上</p>
<p>：》以后就不会有担心这句话：没人知道电脑的对面是一只狗</p>
<p>把设想更伟大点，有一天可以通过页面，判断人的犯罪倾向，早发现早治疗，一片和谐</p>
<p><strong>一点担心</strong></p>
<p>被识别的越多，意识我的隐私泄露越多……现在的人肉已经很可怕了</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.cike.org/2009/sexm-atch-by-web/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
