关于jieba.cut与jieba.lcut的区别及说明
目录
- jieba.cut与jieba.lcut的区别
- jieba的几个分词接口:cut、lcut、posseg.cut、posseg.lcut
- 总结
jieba.cut与jieba.lcut的区别
jieba.cut生成的是一个生成器,generator,也就编程客栈是可以通过for循环来取里面的每一个词。
word_list= [word for word in jieba.cut(text)]
jieba.lcut 直接生成的就是一个list
Prefix dict has been built succesfully. Full Model 我/来/北京/上学 ['我', '来', '北京', '上学']
jieba的几个分词接口:cut、lcut、posseg.cut、posseg.lcut
cut
cut提供最基本的分词功能,返回的结果是个生成器generator,可通过迭代的方法访问各个分词
lcut
lcut和cut方法的区别是:lcut返回的是list。也可以通过list(jieba.cut()) 来等价jieba.lcut()
prosseg
的方法 开发者_JAVA教程
posseg.chttp://www.devze.comut 和 posseg.lcut的区别雷同,只不过posseg还提供了词性,方便对句法做分析
s = '我们都是小青蛙 呱呱呱呱 喜欢快乐的生活 还会讲笑话' import jieba jieba.cut(s) # <generator object cut at 0x10a6e5500> list(jieba.cut(s)) # [u'\u6211\u4eec', u'\u90fd', u'\u662f',...] jieba.lcut(s) # [u'\u6211\u4eec', u'\u90fd', u'\u662f',...] impor编程t jieba.posseg jieba.posseg.cut(s) # <generator object cut at 0x10cc80eb0> list(jieba.posseg.cut(s)) # [pair(u'\u6211\u4eec', u'r'), pair(u'\u90fd', u'd')...] jieba.posseg.lcut(s) # [pair(u'\u6211\u4eec', u'r'), pair(u'\u90fd', u'd')...]编程客栈
总结
以上为个人经验,希望能给大家一个参考,也希望大家多多编程客栈支持我们。
精彩评论