| 程序包 | 说明 |
|---|---|
| com.hankcs.hanlp.model.crf | |
| com.hankcs.hanlp.model.hmm | |
| com.hankcs.hanlp.model.perceptron |
感知机在线学习算法的线性序列标注模型。
|
| com.hankcs.hanlp.tokenizer |
一些常用的配置好的静态分词器,其中一些具备特殊的预处理功能
可供用户参考以实现自己的预处理逻辑. |
| com.hankcs.hanlp.tokenizer.lexical |
| 限定符和类型 | 类和说明 |
|---|---|
class |
CRFLexicalAnalyzer
CRF词法分析器(中文分词、词性标注和命名实体识别)
|
| 限定符和类型 | 类和说明 |
|---|---|
class |
HMMLexicalAnalyzer
基于隐马尔可夫模型的词法分析器
|
| 限定符和类型 | 类和说明 |
|---|---|
class |
PerceptronLexicalAnalyzer
感知机词法分析器,支持简繁全半角和大小写
|
| 限定符和类型 | 字段和说明 |
|---|---|
static AbstractLexicalAnalyzer |
NLPTokenizer.ANALYZER
预置分词器
|
| 限定符和类型 | 方法和说明 |
|---|---|
AbstractLexicalAnalyzer |
AbstractLexicalAnalyzer.enableRuleBasedSegment(boolean enableRuleBasedSegment)
是否执行规则分词(英文数字标点等的规则预处理)。
|
Copyright © 2014–2019 码农场. All rights reserved.