Apache OpenNLP 1.9.1 发布了,OpenNLP 是一个机器学习工具包,用于处理自然语言文本。支持大多数常用的 NLP 任务,例如:标识化、句子切分、部分词性标注、名称抽取、组块、解析等。

更新内容如下:

  • 新增 TrigramNameFeatureGeneratorFactory

  • 文档更新

  • 单元测试改进

  • TokenFeatureGeneratorFactory 现在允许设置小写标志

  • 使用 ja 代替日语代码而不是 jp

  • DefaultEndOfSentenceScanner 中使用 hash 避免线性搜索

  • Opennlp 允许设置堆大小

  • 使用 Java 11 构建

  • 使用守护进程线程执行 executor 服务

  • 允许迭代词向量表 token

发布公告

下载地址:https://opennlp.apache.org/download.html