Class TikTokensUtil


  • public class TikTokensUtil
    extends Object
    描述:token计算工具类
    Since:
    2023-04-04
    Author:
    https:www.unfbx.com
    • Constructor Detail

      • TikTokensUtil

        public TikTokensUtil()
    • Method Detail

      • encode

        public static List<Integer> encode​(@NotNull
                                           @NotNull com.knuddels.jtokkit.api.Encoding enc,
                                           String text)
        通过Encoding和text获取编码数组
        Parameters:
        enc - Encoding类型
        text - 文本信息
        Returns:
        编码数组
      • tokens

        public static int tokens​(@NotNull
                                 @NotNull com.knuddels.jtokkit.api.Encoding enc,
                                 String text)
        通过Encoding计算text信息的tokens
        Parameters:
        enc - Encoding类型
        text - 文本信息
        Returns:
        tokens数量
      • decode

        public static String decode​(@NotNull
                                    @NotNull com.knuddels.jtokkit.api.Encoding enc,
                                    @NotNull
                                    @NotNull List<Integer> encoded)
        通过Encoding和encoded数组反推text信息
        Parameters:
        enc - Encoding
        encoded - 编码数组
        Returns:
        编码数组对应的文本信息
      • getEncoding

        public static com.knuddels.jtokkit.api.Encoding getEncoding​(@NotNull
                                                                    @NotNull com.knuddels.jtokkit.api.EncodingType encodingType)
        获取一个Encoding对象,通过Encoding类型
        Parameters:
        encodingType - encodingType
        Returns:
        Encoding
      • encode

        public static List<Integer> encode​(@NotNull
                                           @NotNull com.knuddels.jtokkit.api.EncodingType encodingType,
                                           String text)
        获取encode的编码数组
        Parameters:
        text - 文本信息
        Returns:
        编码数组
      • tokens

        public static int tokens​(@NotNull
                                 @NotNull com.knuddels.jtokkit.api.EncodingType encodingType,
                                 String text)
        计算指定字符串的tokens,通过EncodingType
        Parameters:
        encodingType - encodingType
        text - 文本信息
        Returns:
        tokens数量
      • decode

        public static String decode​(@NotNull
                                    @NotNull com.knuddels.jtokkit.api.EncodingType encodingType,
                                    @NotNull
                                    @NotNull List<Integer> encoded)
        通过EncodingType和encoded编码数组,反推字符串文本
        Parameters:
        encodingType - encodingType
        encoded - 编码数组
        Returns:
        编码数组对应的字符串
      • getEncoding

        public static com.knuddels.jtokkit.api.Encoding getEncoding​(@NotNull
                                                                    @NotNull String modelName)
        获取一个Encoding对象,通过模型名称
        Parameters:
        modelName - 模型名称
        Returns:
        Encoding
      • encode

        public static List<Integer> encode​(@NotNull
                                           @NotNull String modelName,
                                           String text)
        获取encode的编码数组,通过模型名称
        Parameters:
        text - 文本信息
        Returns:
        编码数组
      • tokens

        public static int tokens​(@NotNull
                                 @NotNull String modelName,
                                 String text)
        通过模型名称, 计算指定字符串的tokens
        Parameters:
        modelName - 模型名称
        text - 文本信息
        Returns:
        tokens数量
      • decode

        public static String decode​(@NotNull
                                    @NotNull String modelName,
                                    @NotNull
                                    @NotNull List<Integer> encoded)
        通过模型名称和encoded编码数组,反推字符串文本
        Parameters:
        modelName - 模型名
        encoded - 编码数组
        Returns:
        返回源文本
      • getModelTypeByName

        public static com.knuddels.jtokkit.api.ModelType getModelTypeByName​(String name)
        获取modelType
        Parameters:
        name - 模型名称
        Returns:
        ModelType