Package org.bitlap.geocoding.core.impl
See: Description
-
Class Summary Class Description DefaultAddressInterpreter Desc: 地址解析操作 从地址文本中解析出省、市、区、街道、乡镇、道路等地址组成部分 Mail: chk19940609@gmail. DefaultAddressPersister Desc: 地址持久层的操作, 这边暂时只是对标准地址库的处理. DefaultRegionCache Desc: 默认 RegionEntity 获取的缓存类 默认从 region.dat 中获取 Mail: chk19940609@gmail. RegionInterpreterVisitor Desc: 基于倒排索引搜索匹配省市区行政区划的访问者 Mail: chk19940609@gmail. SimilarityComputer Desc: 相似度算法相关逻辑 关于 TF-IDF
TC: 词数 Term Count, 某个词在文档中出现的次数
TF: 词频 Term Frequency, 某个词在文档中出现的频率. TF = 该词在文档中出现的次数 / 该文档的总词数
IDF: 逆文档词频 Inverse Document Frequency. IDF = log( 语料库文档总数 / ( 包含该词的文档数 + 1 ) ). 分母加1是为了防止分母出现0的情况
TF-IDF: 词条的特征值, TF-IDF = TF * IDF