网页识别性别-我很MAN,网易鉴定
四月 29, 2009, Posted by cike at 6:42 下午

这里查看:http://www.yodao.com/blogender/result2.jsp?keyfrom=blogender.help&url=http%3A%2F%2Fcike.org
测试发现,有道是挖掘数据来自你的RSS,没有RSS接口就会报错
为什么要挖掘RSS
XML数据优点不用多说,还有一个重要点RSS一般不会包括评论的内容,试想HEBI的博客有多少GG在留言评论,大量明显男性化的评论,可以把整站彻底男性化,如此这个鉴定就没意义了
猜测判断性别流程:提交关键词-》特征库比对-》得出结论
如MM爱写嘻嘻、呵呵、555555,减肥、美白、逛街……一些MM专用品牌名都可以作为依据,判断精准度很大部分依赖这个知识设计者于对用户行为、习惯的经验积累,设计者未知晓的领域就定为半男半女吧,随机测试了几个英文网志,都是55分,半男半女
还可以判断更多
性别可以,年龄、职业也应可以,流程一样,不同仅在特征库上
:》以后就不会有担心这句话:没人知道电脑的对面是一只狗
把设想更伟大点,有一天可以通过页面,判断人的犯罪倾向,早发现早治疗,一片和谐
一点担心
被识别的越多,意识我的隐私泄露越多……现在的人肉已经很可怕了




