content = '''勤俭节约是什么?虽然一直把这个词挂在嘴边,但是你们真的做过勤俭节约的事吗?你们真的理解了这个词吗?让我们先来说说钱物吧!
父母的钱都来之不易,有打工的,也有的是日夜奔波到客户家里推销产品的、出差到好几个月才回一次家的……而因为你的贪吃、贪玩,这些血汗钱都被一点一滴的“吞噬”,而父母的生活也得因为你而变得艰难,哪怕你的家境多么富裕,因为你的随意挥霍,这些钱财总会花光的。
所以,我们要将那些买零食、买游戏卡、玩具的钱攒起来。一天、两天、三天……你总会攒到很多钱的:十元、一百元甚至一千元!你会变成一个“小富翁”!小时候的成功,会对你未来的事业很有帮助,钱物上的节约,请千万要记住哦!
再来说说资源吧。随着经济的飞速发展和人们的生活水平日益提高,而使用的资源也不断的增多,资源也更加短缺。我们在生活中洗手完水龙头有拧紧吗?我们出门了有把空调还一直开着吗?仔细想想,我们肯定有过这样的事儿,你、我、他,应该都有吧。
可是我们曾想过这会对世界资源造成影响吗?没有吧!我们只是想:管它的呢,一个水龙头而已,流也流不了多少水,顶多让爸妈多交点水费吧……如今世界资源的紧张,环境的恶化,将节约提到了一种新的境界——社会节约,就是以多数人甚至所有人的人生幸福为目标,追求社会整体效益、力避各种浪费的社会运动。你,做到了吗?
如果你还在挥霍你的父母的血汗钱,如果你的厕所水龙头还没关,房间电灯还没关,那么请你伸出你的双手去把它们关了,把自己准备买的不该买的东西的钱赞起来,我想这很容易做到吧?伸手、攒钱不是太麻烦吧?要知道,没了这些资源与生活的基本条件,我们该怎么办呢?'''
import time
import jieba
jieba.enable_parallel()
t1 = time.time()
words = "/ ".join(jieba.cut(content))
t2 = time.time()
tm_cost = t2-t1
print('关闭并行分词模式speed %s bytes/second' % (len(content)/tm_cost))
关闭并行分词模式speed 205981.04078116026 bytes/second
import jieba
jieba.enable_parallel(4)
# url = 'article.txt'
# content = open(url,"rb").read()
t1 = time.time()
words = "/ ".join(jieba.cut(content))
t2 = time.time()
tm_cost = t2-t1
print('开启并行分词模式speed %s bytes/second' % (len(content)/tm_cost))
开启并行分词模式speed 49142.73858750578 bytes/second
分词的结果可以按以下方式写出:
log_f = open("xx_fenci1.txt","wb")
log_f.write(words.encode('utf-8'))
2938