1. 平台介绍
1.1 整体概述
山大AI助手包含众多依托大模型的功能模块,旨在为校园用户提供高效、智能的支持,涵盖科研、教学、服务、法律及管理等领域,提升师生在科研、教学和管理中的工作效率,满足多样的智能化需求。
通用智能:基座大模型核心引擎,使用校园内数据进行微调训练,满足校园用户的基本问答需求。
科研辅助:支持论文翻译、润色、总结、综述、问答等功能,为师生日常科研工作提供全面支持。
教学助手:基于主题生成PPT,提供交互式编辑功能,提升日常教学及学术汇报材料的准备效率。
服务咨询:通过挂载领域知识库,来提供精准的问答服务,支持意图识别、多轮对话、插件调用。
法鉴通识:司法领域垂直模型,支持法律咨询、辅助判决、文书生成、合同审查等专业法律服务。
管理决策:具备Text2SQL及图表生成功能,用户可通过自然语言查询和分析数据,助力管理决策。

1.2 多端适配
网页端:通过浏览器访问,具备良好的跨平台兼容性,适用于 Windows、macOS 等主流操作系统。

移动端:支持手机APP端便携访问,适用于iOS、Android、HarmonyOS等主流操作系统。

1.3 运营后台
提供运营管理平台,提供便捷的配置及维护功能,保障各场景模块高效、稳定的运行。

借助工作流引擎,可通过可视化拖拽组件的方式对应用进行编排,满足灵活多变的场景需求。

2. 通用智能
2.1 模块简介
基座模型经过微调训练,融合了丰富的山大内部数据资源,使其在处理与山大相关的问题时表现更加出色。该模型采用了私有化部署的方案,确保用户数据完全留存在山大内部环境中,避免外部泄露,最大程度地保障数据安全。采用Ray分布式架构结合vLLM技术加速模型推理,显著提升了推理效率,同时引入负载均衡机制,保障其能够满足一定规模的并发需求。

2.2 模块展示
[1] 智能引擎:校内部署的模型,支持深度思考、联网搜索、附件上传、多轮对话等能力。

[2] 智能写诗:生成符合用户需求的诗歌,以优美、感性的语言表达思想和情感。

3. 科研辅助
3.1 模块简介
科研辅助是一款面向科研工作者的智能工具,集成多项前沿技术,全面提升文献管理、语言处理与学术研究效率。通过正则表达式与元素挖掘技术,可高效提取LaTeX与PDF中的关键信息,简化数据处理流程,助力科研人员专注核心研究。

科研辅助通过大模型提示工程,支持高效检索、精准翻译、语法润色及中英文风格智能转换,便于快速实现语言与风格替换。同时具备强大摘要与总结功能,快速提炼长文核心内容,并通过智能问答系统提供准确、高效的学术解答,显著提升科研效率。

3.2 模块展示
[1] 论文搜索:根据关键词高效检索相关学术论文,帮助师生快速获取所需文献资料。

[2] 论文翻译:将英文论文翻译成中英文对照版本,方便用户快速阅读和理解。

[3] 论文问答:总结论文核心思想,回答用户提问,助力快速掌握内容,提供精准学术解答。

[4] 文献综述:从多篇论文中提炼出相关综述,帮助用户了解某研究领域的整体情况。

[5] 论文润色:对英文论文进行语法和学术规范的润色,提高论文的质量和可读性。

[6] 语法检查:对输入的论文内容进行语法检查,确保语言准确无误,符合学术规范。

4. 教学助手
4.1 模块简介
教学助手运用大语言模型提供基于主题的PPT自动生成服务,能自动搜索并生成相关素材,迅速完成PPT制作,包括内容摘要、图片提取和自动布局等功能。此外,还支持基于LaTeX的PPT生成,快速转化科研论文为PPT,极大提升师生的学习与工作效率。

4.2 模块展示
PPT辅助生成:基于主题和LaTeX快速生成PPT,支持内容自动生成和交互式编辑。
Step1:用户输入主题和页数,选择PPT模板后,系统将自动生成包含相关文本和图像的PPT草稿。

Step2:在生成的草稿基础上,用户可以利用大模型及联网能力查找资料,修改素材里的文本及图片。

Step3:在对每页的素材调整完成后,可将PPT导出到本地,有需求的话还可以进一步精细调整。

5. 服务咨询
5.1 模块简介
旨在打造一个涵盖多领域的智能知识库问答系统,通过整合校内各业务部门的领域知识库,为广大师生提供全面、精准的问答服务。为了应对这些知识库信息频繁更新的挑战,我们采用了检索增强生成技术来实现。

除了采用常规的RAG流程外,我们还从多个技术环节对问答系统进行了全流程优化,旨在提升系统的准确率与召回率,从而增强用户满意度。涵盖文件解析、知识切片、意图识别、多轮对话、插件调用、数据检索及回复生成等各个关键环节。
5.2 模块展示
[1] 服务咨询问答:服务咨询覆盖校内各业务部门的知识库,提供全面的政策解读、流程指引和事务咨询服务。

支持插件调用,不仅实现信息查询功能,还可打通各业务系统,实现以问答形式驱动的事务办理。

[2] 时事新闻问答:提供山大最新时事新闻的解读和相关问题的解答,帮助用户了解新闻动态。

[3] 智能图书推荐:为师生提供个性化的图书推荐服务,支持按兴趣、学术需求或职业规划推荐图书。
Step1:支持图书检索、图书查阅、图书馆知识问答等能力,自动对用户问题进行分类。

Step2:检索出来的图书已经与图书馆信息打通,点击即可跳转到图书馆对应的数目页面。

6. 法鉴通识
6.1 模块简介
法鉴通识依托于我们自主研发的夫子·明察司法大模型而实现,该模型不仅能够应对广泛的司法问答需求,还能通过精细的提示工程和工具链设计,转化为针对特定领域的法律工具,应用场景包括:

我们通过各种渠道收集并标注了海量的司法领域专业数据,是基于中文无监督司法语料(包括各类判决文书、法律法规等)与有监督司法微调数据(包括法律问答、类案检索)训练而成的。

本模型获得过业内的诸多奖项,在法律领域内有领先的能力水准:
2023世界工业互联网产业大会:2023年度大模型优秀创新应用案例。
第二十五届中国园际高新技术成果交易会:优秀产品奖。
上海AI实验室联合南京大学推出大语言模型司法能力评估体系:在法律专精模型中,山东大学的Fuzi-Mingcha和北京大学的ChatLaw-13B得到最好结果。

6.2 模块展示
[1] 司法问答:提供通用司法领域的问答服务,解答法律相关的基础问题,普法宣传。

[2] 法条检索:通过知识库检索法律法规和政策文件,快速获取相关法条内容。

[3] 类案推荐:提供类似案件卷宗的信息,帮助法律从业者参考类案辅助分析案件。

[4] 合同审查:对上传的合同文件进行自动审查,提供风险点分析和详细审查报告。

7. 管理决策
7.1 模块简介
为了提升用户在数据库查询和数据解读方面的体验,我们引入了Text2SQL功能并集成了图表生成,使用户能通过自然语言直接向数据库提问并即时获取数据的可视化结果。用户无需掌握复杂的SQL语法,只需输入自然语言查询,系统即可生成相应的SQL并提取数据。同时,系统会根据结果生成直观的图表,帮助用户更轻松地理解和分析数据。

我们通过整合多项前沿技术,对基座模型在Text2SQL任务中的语义理解与逻辑推理能力进行了全面优化,主要包括以下几项关键技术:
思维链推理(Chain-of-Thought):帮助模型将复杂查询分解为小步骤,以逐步构建SQL查询;
代码表示提示(Code Representation Prompt):通过与代码结构紧密相关的格式加强了模型对SQL语法的理解;
上下文学习(In-Context Learning):使模型能够利用示例快速适应不同查询环境;
自洽性生成(Self-Consistency):通过多次生成和评估,确保SQL查询的一致性;
检索增强生成(Retrieval-Augmented Generation):结合外部知识检索与生成模型的能力,提升了查询处理的精准度。
通过这些技术的深度融合,模型在处理复杂自然语言查询时能够更加精准地解析语义,并在生成SQL查询的过程中,充分考虑数据库结构和上下文信息。通过这一多层次的优化策略,大幅提升了基座模型的理解能力,保障了模型回答的准确性和适应性。

7.2 模块展示
智能数据查询:通过自然语言对话,生成并执行SQL语句,智能检索数据库信息,并以直观的图表形式呈现查询结果。

8. 规划展望
8.1 人机协同
未来将支持人机协同交互式的智能文档撰写,快速生成各类企业文书与专业报告,如会议纪要、工作总结、分析报告等。显著提升内容生成的效率与质量,降低人工撰写成本,助力团队高效协同、提升整体办公效能。

8.2 辅助决策
未来将逐步推进辅助决策智能体的建设,通过多种Agent协同,增强对科研数据的理解、分析与推理能力,实现更加高效、智能的决策支持,为科研管理提供精准洞察与策略建议,助力科研资源配置优化与管理效能提升。
