Chinese Words Segmentation Utilities
“结巴”中文分词:做最好的 Python 中文分词组件
"Jieba" (Chinese for "to stutter") Chinese text segmentation: built to be the best Python Chinese word segmentation module.
完整文档见 README.md
GitHub: https://github.com/fxsjy/jieba
支持三种分词模式:
支持繁体分词
支持自定义词典
MIT 授权协议
在线演示: http://jiebademo.ap01.aws.af.cm/
代码对 Python 2/3 均兼容
easy_install jieba
或者 pip install jieba
/ pip3 install jieba
import jieba
来引用