| 类和说明 |
|---|
| com.hankcs.hanlp.dictionary.BiGramDictionary
现在基于DoubleArrayTrie的BiGramDictionary已经由CoreBiGramTableDictionary替代,可以显著降低内存
|
| com.hankcs.hanlp.dependency.CRFDependencyParser
关于将线性CRF序列标注应用于句法分析,我持反对意见。CRF的链式结构决定它的视野只有当前位置的前后n个单词构成的特征,
如果依存节点恰好落在这n个范围内还好理解,如果超出该范围,利用这个n个单词的特征推测它是不合理的。
也就是说,我认为利用链式CRF预测长依存是不科学的。线性链CRF做句法分析的理论基础非常薄弱,一阶CRF这个标注模型根本无法阻止环的产生,
这份实现也没有复现论文的结果,所以不再维护,其模型文件也不再打包到新data里面。请使用在理论和工程上更稳定的
NeuralNetworkDependencyParser。 |
| 字段和说明 |
|---|
| com.hankcs.hanlp.utility.Predefine.CT_CHINESE
使用CharType中的相应常量
|
| com.hankcs.hanlp.utility.Predefine.CT_DELIMITER
使用CharType中的相应常量
|
| com.hankcs.hanlp.utility.Predefine.CT_INDEX
使用CharType中的相应常量
|
| com.hankcs.hanlp.utility.Predefine.CT_LETTER
使用CharType中的相应常量
|
| com.hankcs.hanlp.utility.Predefine.CT_NUM
使用CharType中的相应常量
|
| com.hankcs.hanlp.utility.Predefine.CT_OTHER |
| com.hankcs.hanlp.utility.Predefine.CT_SINGLE
使用CharType中的相应常量
|
| com.hankcs.hanlp.seg.common.WordNet.sentence
应当使用数组,这样比较快
|
Copyright © 2014–2018 码农场. All rights reserved.