public class CustomDictionary extends Object
| 限定符和类型 | 字段和说明 |
|---|---|
static DoubleArrayTrie<CoreDictionary.Attribute> |
dat |
static BinTrie<CoreDictionary.Attribute> |
trie
用于储存用户动态插入词条的二分trie树
|
| 构造器和说明 |
|---|
CustomDictionary() |
| 限定符和类型 | 方法和说明 |
|---|---|
static boolean |
add(String word)
往自定义词典中插入一个新词(非覆盖模式)
动态增删不会持久化到词典文件 |
static boolean |
add(String word,
String natureWithFrequency)
往自定义词典中插入一个新词(非覆盖模式)
动态增删不会持久化到词典文件 |
static LinkedList<Map.Entry<String,CoreDictionary.Attribute>> |
commonPrefixSearch(char[] chars,
int begin)
前缀查询
|
static LinkedList<Map.Entry<String,CoreDictionary.Attribute>> |
commonPrefixSearch(String key)
前缀查询
|
static boolean |
contains(String key)
词典中是否含有词语
|
static CoreDictionary.Attribute |
get(String key)
查单词
|
static BaseSearcher |
getSearcher(char[] charArray)
获取一个BinTrie的查询工具
|
static BaseSearcher |
getSearcher(String text) |
static BinTrie<CoreDictionary.Attribute> |
getTrie()
已过时。
谨慎操作,有可能废弃此接口
|
static boolean |
insert(String word)
以覆盖模式增加新词
动态增删不会持久化到词典文件 |
static boolean |
insert(String word,
String natureWithFrequency)
往自定义词典中插入一个新词(覆盖模式)
动态增删不会持久化到词典文件 |
static boolean |
load(String path,
Nature defaultNature,
TreeMap<String,CoreDictionary.Attribute> map,
LinkedHashSet<Nature> customNatureCollector)
加载用户词典(追加)
|
static void |
parseText(char[] text,
AhoCorasickDoubleArrayTrie.IHit<CoreDictionary.Attribute> processor)
解析一段文本(目前采用了BinTrie+DAT的混合储存形式,此方法可以统一两个数据结构)
|
static void |
parseText(String text,
AhoCorasickDoubleArrayTrie.IHit<CoreDictionary.Attribute> processor)
解析一段文本(目前采用了BinTrie+DAT的混合储存形式,此方法可以统一两个数据结构)
|
static boolean |
reload()
热更新(重新加载)
集群环境(或其他IOAdapter)需要自行删除缓存文件(路径 = HanLP.Config.CustomDictionaryPath[0] + Predefine.BIN_EXT) |
static void |
remove(String key)
删除单词
动态增删不会持久化到词典文件 |
String |
toString() |
public static BinTrie<CoreDictionary.Attribute> trie
public static DoubleArrayTrie<CoreDictionary.Attribute> dat
public static boolean load(String path, Nature defaultNature, TreeMap<String,CoreDictionary.Attribute> map, LinkedHashSet<Nature> customNatureCollector)
path - 词典路径defaultNature - 默认词性customNatureCollector - 收集用户词性public static boolean add(String word, String natureWithFrequency)
word - 新词 如“裸婚”natureWithFrequency - 词性和其对应的频次,比如“nz 1 v 2”,null时表示“nz 1”public static boolean add(String word)
word - 新词 如“裸婚”public static boolean insert(String word, String natureWithFrequency)
word - 新词 如“裸婚”natureWithFrequency - 词性和其对应的频次,比如“nz 1 v 2”,null时表示“nz 1”。public static boolean insert(String word)
word - public static CoreDictionary.Attribute get(String key)
key - public static void remove(String key)
key - public static LinkedList<Map.Entry<String,CoreDictionary.Attribute>> commonPrefixSearch(String key)
key - public static LinkedList<Map.Entry<String,CoreDictionary.Attribute>> commonPrefixSearch(char[] chars, int begin)
chars - begin - public static BaseSearcher getSearcher(String text)
public static boolean contains(String key)
key - 词语public static BaseSearcher getSearcher(char[] charArray)
charArray - 文本public static BinTrie<CoreDictionary.Attribute> getTrie()
public static void parseText(char[] text,
AhoCorasickDoubleArrayTrie.IHit<CoreDictionary.Attribute> processor)
text - 文本processor - 处理器public static void parseText(String text, AhoCorasickDoubleArrayTrie.IHit<CoreDictionary.Attribute> processor)
text - 文本processor - 处理器public static boolean reload()
Copyright © 2014–2018 码农场. All rights reserved.