Gensim

开源主题建模和文本向量工具,适合语料库分析、Word2Vec 和文本挖掘。

详细介绍

Gensim 是 Python 开源文本挖掘库,常用于主题模型、Word2Vec、Doc2Vec、相似度计算和大规模语料处理。它适合文本分析、文献主题挖掘、语料库研究和 NLP 教学。

适用场景:主题模型、文本挖掘、Word2Vec、语料库分析、NLP

注意:现代 Transformer 模型任务可同时考虑 Hugging Face Transformers。