“结巴”中文分词,值得拥有,有nodejs版本 - TOMMYHU - 专注互联网开发及运营技术,提供相关资料及软件下载,奇趣网络时事评论!
Jan 5

“结巴”中文分词,值得拥有,有nodejs版本 不指定

https://github.com/fxsjy/jieba
支持四种分词模式:
精确模式,试图将句子最精确地切开,适合文本分析;
全模式,把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不能解决歧义;
搜索引擎模式,在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。
paddle模式,利用PaddlePaddle深度学习框架,训练序列标注(双向GRU)网络模型实现分词。同时支持词性标注。paddle模式使用需安装paddlepaddle-tiny,pip install paddlepaddle-tiny==1.6.1。目前paddle模式支持jieba v0.40及以上版本。jieba v0.40以下版本,请升级jieba,pip install jieba --upgrade 。PaddlePaddle官网
支持繁体分词
支持自定义词典
MIT 授权协议

结巴分词 Java 版本
作者:piaolingxue 地址:https://github.com/huaban/jieba-analysis

结巴分词 C++ 版本
作者:yanyiwu 地址:https://github.com/yanyiwu/cppjieba

结巴分词 Rust 版本
作者:messense, MnO2 地址:https://github.com/messense/jieba-rs

结巴分词 Node.js 版本
作者:yanyiwu 地址:https://github.com/yanyiwu/nodejieba

结巴分词 Erlang 版本
作者:falood 地址:https://github.com/falood/exjieba

结巴分词 R 版本
作者:qinwf 地址:https://github.com/qinwf/jiebaR

结巴分词 iOS 版本
作者:yanyiwu 地址:https://github.com/yanyiwu/iosjieba

结巴分词 PHP 版本
作者:fukuball 地址:https://github.com/fukuball/jieba-php

结巴分词 .NET(C#) 版本
作者:anderscui 地址:https://github.com/anderscui/jieba.NET/

结巴分词 Go 版本
作者: wangbin 地址: https://github.com/wangbin/jiebago
作者: yanyiwu 地址: https://github.com/yanyiwu/gojieba
结巴分词Android版本
作者 Dongliang.W 地址:https://github.com/452896915/jieba-android
Last modified by tommyhu on2021/01/05 15:51
Add a comment

Nickname

emotemotemotemotemotemotemotemotemotemotemotemotemotemotemotemot