三个库更新到了最新版本---Transformers, BERTopic和Gensim

1 引言

对于任何代码或软件, 如果开发出来不继续维护和更新,那么这样的工具是没有发展潜力的. 目前使用的几个主要库最近几天都释放了新的版本, 包括transformers, bertopic和gensimm,因此更新了相应的运行环境. 


Transformers

2021年8月31日, 发布了transformers 4.10.0, 主要使用它的GPT2文本生成功能和英汉互译功能.

不得已而为之---CPU下使用gpt2-large模型进行微调训练

GeotechSet数据集在GPT2上的训练过程

三个库更新到了最新版本---Transformers, BERTopic和Gensim的图1

3 Bertopic

2021年9月1日, 发布了bertopic 0.9.1, 主要用它进行主题模拟. 

BERTopic(V0.9.0)主题模拟技术


4 Gensim

2021年8月30日, 发布了gensim 4.1.0, 主要使用它的Word2Vec功能;

语义相似模型(Doc2Vec)在双语教学中的应用


5 Spacy

2021年8月20日, 发布了spacy 3.1.2, 主要使用基于这个库的sense2Vec和pytextrank.

sense2vec---基于语境的词向量(Contextually-keyed word vectors)

PyTextRank---文本关键字(keywords)的自动取出



登录后免费查看全文
立即登录
默认 最新
当前暂无评论,小编等你评论哦!
点赞 评论 收藏
关注