天壤小白大语言模型
天壤自研新一代通用大语言模型「天壤小白」,参数规模为1860亿,该模型是利用互联网公开数据、采用生成式架构训练而成。 模型拥有广泛的世界语言知识和上下文感知能力,能够精准捕捉文本中的语义关联,精准理解用户指令和意图。具备语义理解、多轮对话、多语言翻译、知识处理、智能问答、逻辑推理等多项核心能力,并通过不断学习新的文本数据,以实现模型效果优化和技能提升。
✨ 模型能力 #
1. 文本分类 #
内容分类
概念:基于文本内容,按照预定的类别进行分类的技术。
应用:
新闻分类:根据新闻的内容判断其所属的类别 (政治/经济/娱乐等),从而提高舆情分析的准确性和效率。
内容审核:对在线社区用户产生内容做自动审核,根据文本内容判断其所属安全分类 (涉黄/涉政/违禁物品/辱骂/暴力/诈骗犯罪等)。
情感分类
概念:对文本内容所表达的情感倾向进行判断。
应用:
用户评价分析:对用户反馈内容做情感分析,准确把握客户情绪,提高客户服务的满意度。
社交媒体评论分析:对社交媒体中的用户评论和反馈进行情感分析,以此为基础改善公司的产品或服务。
2. 摘要 #
定义:对一段长文本进行提炼和概括,保留原文核心内容,生成一段较短的文本。
应用:
- 新闻摘要:无需阅读整个文档即可获取所有的关键信息点,节省大量时间。
3. 实体抽取 #
概念:从文本中识别出具有特定含义的词语或短语,包括对实体的检测和分类,比如识别人名、地名等
应用:
- 合同要素提取:提取出合同中的重要条款和关键信息,包括但不限于公司名称、服务内容等。合同要素提取可用于合同审核、风险评估、合同履行监控等场景。
4. 文本生成 #
概念:基于给定的初始上下文,自动地生成具有语法正确性和语义连贯性的文章、段落、句子或短语。
应用:
生成多风格文本:面向社交媒体、工作文档或创意写作场景,通过转换文本风格,轻松完成表达,无需繁琐修改,只需专注思考内容。
生成文案:在营销、创作等不同场景下精准生成合适的宣传推广文案,提供更相关、更有针对性的文案内容,实现多样化的文案生成需求。
生成大纲:根据用户输入的主题内容,快速生成PPT大纲,提高工作效率。
生成报告:根据用户的要求,准确生成各类学术、工作报告以及会议纪要。
5. 逻辑推理 #
概念:模型能够根据已知的信息推导出新的结论或判断。当用户提供的问题或上下文不够明确时,大模型可以通过分析相关信息并运用逻辑推理,给出合理的答案或建议。
应用:推理和决策支持,帮助解决需要逐步思考的复杂问题。
6. 多轮对话 #
概念:大模型能够理解上下文并提供连贯准确的回应,进行流畅、自然的对话。
应用:企业智能客服。解决80%的用户常见问题,帮助企业降本增效。
7. 多语言翻译 #
概念:可以理解和处理多种语言的输入,并提供准确的翻译结果。
应用:文本翻译。支持多种语言翻译或任意格式文档的文档翻译( PDF、DOC、HTML、TXT),翻译更高效、地道,目前支持多种翻译语言,如:英文、韩文、古巴文、牙买加语等。
🚀 模型优势 #
出色的多轮对话能力
支持连续对话至少10轮以上,无论是针对特定主题的深入探讨,还是处理用户的历史问答,大模型都能够理解上下文并提供连贯准确的回应,使对话更加流畅和自然。
敏锐的提示词感知能力
通过对大量语言数据的深度学习,具备深度理解语义,更好的捕捉提示词语的关键信息,准确理解用户意图,只需少量特定的提示词,就能激发出大模型更强大的理解与推理能力,并利用丰富的知识提供更相关、更准确的回答。
强大的推理能力
能够根据已有的信息进行推断。当用户提供的问题或上下文不够明确时,大模型可以通过分析相关信息并运用逻辑推理,给出合理的答案或建议。
领先的多语言翻译
深度理解全球数十种语言语境,可提供更准确、更通顺自然的翻译结果。无论是将一种语言翻译成另一种语言,还是在不同语言之间进行对话,大模型都能够提供高质量的翻译服务。
不同成本的参数模型
提供多版本参数和精度的模型服务,包含1860亿参数的FP16和INT4大模型、130亿参数的FP16大模型和70亿参数的小模型,供开发者根据实际需求选择不同的模型方案。