做个关键词替换工具-分词
文章由http://www.vsseo.com原创,转载请注明出处-
上海seo
做伪原创工具首先要分词,分词要词库的支持,在网上找了一些工具,比较好的是哈工大分词,和ictclas.org这个分词,哈工大分词的借口有java和c++的,后一种分词有高手已经做出来了,但词库只是共享了了一部分,没法用,这个伪原创工具是属于自然语言识别中的范畴,把找到的资源和大家共享一下:
哈工大的一网站
http://ir.hit.edu.cn/这个是分词演示,测试了一下很牛,估计百度等一些需要这个功能的机构或个人都应该参考或者应用这个东西
http://ir.hit.edu.cn/demo/ltp/这个是他们的论坛 东西不多 好多都是06 07年的 看来这个研究很早就有了
http://ir.hit.edu.cn/bbs/index.php哈工大分词提供源文件下载,他里面还有个同义词字,大概有7万多个同义词,论坛里面有介绍,想用的朋友可以详细的看看,有了这两个功能相信做伪原创工具就不难了。
还有个是ictclas.org 专门研究分词的机构,但东西都是共享版的。里面有好多sample可以直接用,但是效果一般,专业版的要收费。
这些程序和文件下载了很多,但是里面带着词库,体积较大就不上传了,有研究这东东的朋友欢迎交流。