你的位置:小程序开发价钱 > 小程序开发公司 > 小程序开发价格 太强了!各个行业的AI大模子!金融、训导、医疗、法律..

小程序开发价格 太强了!各个行业的AI大模子!金融、训导、医疗、法律..

时间:2024-09-28 15:18:35 点击:51 次

一、医疗界限大模子小程序开发价格

1、DoctorGLM

基于ChatGLM-6B的超卓汉文问诊模子,它交融了海量的汉文医疗对话数据集进行精确微调,收受lora、p-tuningv2等前沿时刻达成高效部署。

形式地址:https://github.com/xionghonglin/DoctorGLM

论文地址:https://arxiv.org/abs/2304.01097

2、BenTsao (本草)

该形式集大成者,开源了多款经过汉文医学指示微调的大言语模子,涵盖LLaMA、Alpaca-Chinese、Bloom等,皆以医学知识图谱和医学文件为基础,市欢ChatGPT API全心打造,达成了汉文医学指示微调数据集的精确考验,极大提高了医疗界限问答的准确性与实用性。

形式地址:https://github.com/SCIR-HI/Huatuo-Llama-Med-Chinese

论文地址:https://arxiv.org/abs/2304.06975

3、Med-ChatGLM

该形式雷同基于汉文医学指示微调,对ChatGLM-6B模子进行了深度优化,微调数据与BenTsao形式世代相承,确保了模子在医疗界限的超卓表示。

形式地址:https://github.com/SCIR-HI/Med-ChatGLM

4、BianQue (扁鹊)

该形式始创性地推出了糊口空间健康大模子,深度整合了现时开源的汉文医疗问答数据集,市欢自建的糊口空间健康对话大数据,构建了千万级别的扁鹊健康大数据BianQueCorpus,基于此全心打造了ChatGLM-6B为启动化的BianQue模子,全面提高了模子在医疗与健康界限的应用价值。

形式地址:https://github.com/scutcyr/BianQue

5、HuatuoGPT (华佗)

该形式随便推出医疗大模子HuatuoGPT,其中包括了基于Baichuan-7B考验的HuatuoGPT-7B与基于Ziya-LLaMA-13B-Pretrain-v1的HuatuoGPT-13B,旨在提供全场地、高圭臬的医疗智能奇迹。

形式地址:https://github.com/FreedomIntelligence/HuatuoGPT

论文地址:https://arxiv.org/abs/2305.15075

6、QiZhenGPT该形式通过启真医学知识库的精妙利用,构建了依样画葫芦的汉文医学指示数据集,进一步在Chinese-LLaMA-Plus-7B、CaMA-13B、ChatGLM-6B等顶端模子上全心调理指示,显贵提高了模子在汉文医疗环境中的实用效果。

形式地址:https://github.com/CMKRG/QiZhenGPT

7、ChatMed

该形式改进性地发布了汉文医疗大模子ChatMed-Consult,以ChatMed_Consult_Dataset中特别50万的汉文医疗在线问诊数据及ChatGPT的精确修起行为考验基石,基于LlaMA-7b并通过LoRA时刻进行了详微弱调。

形式地址:https://github.com/michael-wzhu/ChatMed

8、ShenNong-TCM-LLM(神农)

该形式推出了汉文中医药界限的隆起模子ShenNong-TCM-LLM,以中医药知识图谱为基础,利用实体为中枢的自指示步调,通过ChatGPT生成了丰富的2.6万+中医药指示数据集ChatMed_TCM_Dataset,再基于LlaMA底座,借助LoRA时刻进行了精确微调。

形式地址:https://github.com/michael-wzhu/ShenNong-TCM-LLM

9、XrayGLM

该形式始创了汉文多模态医学数据集与模子的先河,尤其在医学影像会诊与多轮交互对话中展现出超卓的潜能。

形式地址:https://github.com/WangRongsheng/XrayGLM

10、MedicalGPT

该形式肥大推出了医疗大模子MedicalGPT,集成了增量预考验、有监督微调、RLHF(奖励建模、强化学习考验)和DPO(奏凯偏好优化)等前沿时刻。

形式地址:https://github.com/shibing624/MedicalGPT

11、Sunsimiao(孙想邈)

该形式推出了汉文医疗大模子Sunsimiao,该模子以baichuan-7B和ChatGLM-6B为坚实底座,在数十万条高质料的汉文医疗数据中进行了全心微调。

形式地址:https://github.com/thomas-yanxin/Sunsimiao

12、CareLlama(温和羊驼)

形式地址:https://github.com/itsharex/CareLlama

该形式推出了医疗大模子CareLlama,并采集了数十个公开可用的医疗微调数据集和绽开可用的医疗大言语模子,旨在为医疗LLM的快速发展注入强盛能源。

13、DISC-MedLLM

该形式由复旦大学发布,针对医疗健康对话式场景全心联想了医疗界限大模子与数据集。模子通过DISC-Med-SFT数据集在Baichuan-13B-Base基础上进行指示微调,灵验匹配了医疗场景下的东谈主类偏好,减轻了通用言语模子输出与真正寰球医疗对话之间的差距。形式地址:https://github.com/FudanDISC/DISC-MedLLM

小程序开发

论文地址:https://arxiv.org/abs/2308.14346

14、PMC-LLaMA

本形式公开了前沿的医疗大模子PMC-LLaMA,其中包含MedLLaMA_13B预考验版块与PMC_LLaMA_13B指示微调版块,为医疗界限带来了改良的时刻冲突。

形式地址:https://github.com/chaoyi-wu/PMC-LLaMA

论文地址:https://arxiv.org/abs/2304.14454

15、ChatDoctor

ChatDoctor,一款基于LLaMA考验的医疗大模子,其开源特色让更多东谈主大约恍悟医疗科技的魔力。

形式地址:https://github.com/Kent0n-Li/ChatDoctor

论文地址:https://arxiv.org/abs/2303.14070

16、MING (明医)

形式地址:https://github.com/189569400/MedicalGPT-zh

MING,一个基于bloomz-7b指示微调而成的医疗大模子,其超卓的性能在医疗问答、智能问诊等方面得到了充分体现。

17、IvyGPT

IvyGPT,一款医疗大模子,经过高质料的医学问答数据监督微谐和东谈主类反映强化学习考验,展现了出色的智能医疗处理能力。

形式地址:https://github.com/WangRongsheng/IvyGPT

18、PULSE

本形式开源了汉文医疗大模子PULSE,该模子收受约4,000,000个汉文医学与通用界限指示微调数据进行优化,支撑平庸的医疗界限当然言语处理任务,包括健康训导、医生查验问题解答、薪金解读、医疗记载结构化以及模拟会诊和调节等。

形式地址:https://github.com/openmedlab/PULSE

19、HuangDI (天子)

HuangDI,一款中医大模子,其特有之处在于交融了中医课本、网站数据与Ziya-LLaMA-13B-V1基座模子,打造出具有深厚中医知识贯串力的预考验模子,并通过海量中医古籍指示对话数据与通用指示数据进行微调,达成中医古籍知识问答的精确能力。

形式地址:https://github.com/Zlasejd/HuangDI

20、ZhongJing (仲景)

ZhongJing,一个旨在传承中医精髓与当代时刻相市欢的中医大模子。该形式不仅阐述了中医的博大高超,还通过当代时刻改进,为医学界限提供了竟然赖和专科的器具,是中医与AI交融的隆起代表。形式地址:https://github.com/pariskang/CMLM-ZhongJing

21、TCMLLM

该形式旨在通过大型模子时刻,达成中医临床赞成诊疗(包括病证会诊、处方保举等)以及中医药知识问答等多项任务,引颈中医知识问答与临床赞成诊疗等界限的飞跃性跳动。现时,咱们已针对中医临床智能诊疗中的处方保举问题,发布了TCMLLM-PR这一中医处方保举大模子。该模子通过整合真正寰球的临床病历、医学史籍与中医教科书等海量数据,全心构建了包含68k数据条见解处方保举指示微调数据集,并在ChatGLM大模子上进行深度优化与微调。

形式地址:https://github.com/2020MEAI/TCMLLM

22、OpenBioMed

该形式勤勉于开源多模态生物医学大模子,涵盖了BioMedGPT这一多模态生物医药大模子、DrugFM和MolFM等多模态小分子基础模子,以及CellLM等细胞暗意学习模子。

形式地址:https://github.com/PharMolix/OpenBioMed

论文地址:https://arxiv.org/abs/2308.09442

PromptCBLUE医疗评测基准

PromptCBLUE是一个针对汉文医疗场景的评测基准,通过二次开发CBLUE基准,将16种不同的医疗场景NLP任务全面转动为基于领导的言语生成任务,为汉文医疗界限的有计划提供了有劲的支撑。

形式地址:https://github.com/michael-wzhu/PromptCBLUE

论文地址:https://arxiv.org/abs/2308.04823

汉文医疗模子评估基准CMB

A Comprehensive Medical Benchmark in Chinese(CMB)是一项轮廓性的汉文医疗模子评估基准,它涵盖了不同临床奇迹、不同奇迹阶段查验中的多项采用题(CMB-Exam)以及基于真正病例的复杂临床会诊问题(CMB-Clin),为汉文医疗模子的评估提供了全面的参考。

论文地址:https://arxiv.org/abs/2308.08833

形式地址:https://github.com/FreedomIntelligence/CMB

二、4大心绪健康界限大模子

1、MeChat

该形式勤勉于开源汉文心绪健康支撑对话大模子与数据集。该模子基于ChatGLM-6B LoRA 16-bit指示进行了详细的微调。同期,咱们通过ChatGPT时刻将真正的心绪合作QA改写为多轮的心绪健康支撑多轮对话,构建了含有56k个多轮对话的丰富数据集。该数据集的主题、词汇和篇章语义丰富各种,相配适用于长程多轮对话的应用场景。

形式地址:https://github.com/qiuhuachuan/smile

**2、SoulChat (灵心)**该形式开源了心绪健康大模子SoulChat(灵心)。该模子源于ChatGLM-6B的深厚底蕴,经过百万限制心绪征询界限的汉文长文本指示与多轮共情对话数据的全心微调,得以出身。它不单是是一个模子,更是东谈主们心灵的防守者,静静倾听,深情贯串。

形式地址:https://github.com/scutcyr/SoulChat

3、MindChat(座谈)

这一形式勤勉于开源心绪大模子MindChat。经过东谈主工全心清洗的约20万条高质料多轮心绪对话数据,涵盖了责任、家庭、学习、糊口、外交、安全等多个层面,为模子的考验提供了丰富的素材。MindChat守望从心绪征询、心绪评估、心绪会诊、心绪调节四个维度,为东谈主们带来心灵的慰藉与目田,提高举座的心绪健康水平。

形式地址:https://github.com/X-D-Lab/MindChat

4、QiaoBan(巧板)

在儿童情谊伴随界限,QiaoBan这一儿童情谊对话大模子应时而生。它基于开源通用大模子,交融了通用域东谈主机对话、单轮指示数据以及专为儿童联想的情谊伴随对话数据,经过全心微调,最终造成了这款专为儿童量身打造的情谊伴随大模子。

形式地址:https://github.com/HIT-SCIR-SC/QiaoBan

三、10大法律界限微调模子及2大评测基准

1、LawGPT_zh(獬豸)

这一汉文法律通用模子源自ChatGLM-6B与LoRA 16-bit指示的全心交融。数据集方面,形式团队不仅利用了现存的法律问答数据集,更通过self-Instruct时刻,基于法条和真正案例构建了高质料的法律文本问答数据,大幅提高了模子在法律界限的表示,确保了回答的专科性和可靠性。

形式地址:https://github.com/LiuHC0428/LAW-GPT

2、LaWGPT

LaWGPT系列模子在通用汉文基座模子的基础上,增添了法律界限的专有词表和大限制汉文法律语料,极地面增强了模子在法律界限的基础语义贯串能力。市欢法律界限对话问答数据集、中国司法查验数据集的指示精调,LaWGPT对法律内容的贯串和引申能力得到了显贵提高。

形式地址:https://github.com/pengxiao-song/LaWGPT

3、LexiLaw

LexiLaw,这一汉文法律大模子,以ChatGLM-6B为架构基础,经过法律界限数据的全心微调,使得其在法律征询与支撑方面展现出超卓的性能和专科性。不管是法律从业者、学生一经闲居用户,LexiLaw都能为他们提供准确、可靠的法律征询奇迹,助力他们在法律问题的海洋中乘风破浪。

形式地址:https://github.com/CSHaitao/LexiLaw

4、Lawyer LLaMA

这一形式开源了法律界限的指示微调数据和基于LLaMA考验的汉文法律大模子Lawyer LLaMA。Lawyer LLaMA以其超卓的性能和深度,为法律界限带来了前所未有的改进与冲突。LLaMA经过大限制法律语料库的预考验,深入系统地学习了中国的法律知识体系。在此基石之上,咱们借助ChatGPT的灵敏,征集了一系列针对中国国度合并法律奇迹经验查验客不雅题的分析和法律征询的回答,并通过对这些慎重数据的指示微调,使模子具备了将法律知识天真应用于各种具体场景的能力。

探索投降,请拜访形式地址:https://github.com/AndrewZhe/lawyer-llama

深入研读,可拜访论文地址:https://arxiv.org/abs/2305.15062

5、HanFei (韩非)

HanFei-1.0行为国内首个全参数考验的法律大模子,领有高达7b的参数目,其功能涵盖法律问答、多轮对话、著述撰写、检索等多元化需求。

形式地址:https://github.com/siat-nlp/HanFei

6、ChatLaw

北京大学开源的法律大模子系列——ChatLaw,依托海量的法律新闻、论坛、法条、司法证实、法律征询、法考题及判决秘书等原始文本,构建了丰富的对话数据。ChatLaw-13B和ChatLaw-33B即是基于姜子牙-13B、Anima-33B的超卓考验遵循。同期,ChatLaw-Text2Vec更是利用93万条判决案例,基于BERT考验出相似度匹配模子,精确匹配用户发问与对应法条。

形式地址:https://github.com/PKU-YuanGroup/ChatLaw

论文地址:https://arxiv.org/abs/2306.16092

7、Lychee (律知)

咱们开源了基于GLM-10B模子的汉文司法界限大模子Law-GLM-10B,经过30GB汉文法律数据的指示微调,展现出超卓的司法界限应用能力。

形式地址:https://github.com/davidpig/lychee_law

8、wisdomInterrogatory (智海-录问)

由浙江大学、阿里巴巴达摩院及华院诡计联袂打造的法律大模子,该模子基于Baichuan-7B进行了法律界限数据的深度预考验与指示微调,并依样画葫芦肠联想了知识增强的推理经由。

形式地址:https://github.com/zhihaiLLM/wisdomInterrogatory

9、JurisLMs

该形式基于丰富的汉文法学语料库,全心考验了一系列法律界限的言语模子,包括:

AI Judge——一款可证实的法律判决揣摸模子,由GPT2在法学语料上深化预考验,并市欢法条适用模子(基于BERT的分类器)微调而成,不仅能精确揣摸判决摈弃,更能陈述法院的审理不雅点;

AI Lawyer——一款智能法律征询模子,通过主动学习在有限的数据上进行精幽微调,大约针对用户征询,精确匹配并应用相应的法律规章进行回答。

形式地址:https://github.com/seudl/JurisLMs

10、夫子·洞察司法大模子

该模子汇注了法律界限的灵敏,勤勉于司法界限的深度应用与探索。以ChatGLM为基石,咱们全心构建了一个汉文司法大模子,它依托海量的汉文无监督司法语料与精确的有监督司法微调数据。这款模子功能丰富,涵盖法条检索、案例分析、三段论推理判决以及司法对话等,勤勉于为用户提供全面且精确的法律征询与解答奇迹。

形式地址:https://github.com/irlab-sdu/fuzi.mingcha

在法律评测界限,LEXTREME行为一个多言语的法律评测基准,掩饰24种言语,领有11个评测数据集,其巨擘性和全面性备受招供。

形式地址:https://github.com/JoelNiklaus/LEXTREME

论文地址:https://arxiv.org/abs/2301.13126

另一法律评测基准LexGLUE,专注于英文法律评测,以其特有的视角和深度在业界取得了平庸招供。

形式地址:https://github.com/coastalcph/lex-glue

论文地址:https://arxiv.org/abs/2110.00976

四、10大金融界限微调模子及3大评测基准

1、BBT-FinCUGE-Applications

该形式不仅开源了汉文金融界限语料库BBT-FinCorpus,还推出了知识增强型大模子BBT-FinT5及评测基准CFLEB,小程序开发价钱展现了其在金融界限的深厚积存。

论文地址:https://arxiv.org/abs/2302.09432

形式地址:https://github.com/ssymmetry/BBT-FinCUGE-Applications

2、Cornucopia (聚宝盆)

该形式凭借对公开和爬取的汉文金融界限问答数据的深入挖掘,构建了特有的指示数据集,并对LLaMA系模子进行了精确指示微调,显贵提高了模子在金融界限的问答效果。

形式地址:https://github.com/jerry1993-tech/Cornucopia-LLaMA-Fin-Chinese

3、XuanYuan (轩辕)

行为国内首个开源的千亿级汉文对话大模子,轩辕更是针对汉文金融界限进行了深度优化。它基于BLOOM-176B进行了针对性预考验与微调,既能处理通用界限问题,又能提供全面且准确的金融信息与刻毒。

形式地址:https://github.com/Duxiaoman-DI/XuanYuan

论文地址:https://arxiv.org/abs/2305.12002

4、PIXIU (貔貅)形式地址:https://github.com/chancefocus/PIXIU

论文地址:https://arxiv.org/abs/2306.05443 本形式公开了金融界限的指示微调数据集FIT,以及大型模子FinMA与评估基准FLARE,为金融界限注入了智能化新能源。

5、FinGPT

本形式孝顺了多个金融界限的大模子,涵盖ChatGLM2-6B+LoRA和LLaMA2-7B+LoRA等,并采集了金融新闻、外交媒体、财报等多维度中英文考验数据。形式地址:https://github.com/AI4Finance-Foundation/FinGPT

论文地址:https://arxiv.org/abs/2306.06031

6、FLANG

本形式倾力打造了金融大模子FLANG,为金融行业的智能化发展再添新翼。形式地址:https://github.com/SALT-NLP/FLANG

论文地址:https://arxiv.org/abs/2211.00083

10、FinEval

FinEval,一个专注于金融知识的评测基准,汇注了4,661谈高质料多项采用题,掩饰金融、经济、司帐、文凭等多个界限,波及34个不同学术科目。形式地址:https://github.com/SUFE-AIFLM-Lab/FinEval

论文地址:https://arxiv.org/abs/2308.09975

金融界限评测基准:FLARE

FLARE,一个专为金融界限打造的评测基准,它涵盖了金融知识贯串和揣摸等任务,助力金融行业智能化发展。形式地址:https://github.com/chancefocus/PIXIU

论文地址:https://arxiv.org/abs/2306.05443

金融界限评测基准:CFLEB

CFLEB,一个面向汉文金融界限的评测基准,包含了言语生成与贯串的多项任务,为汉文金融界限智能化评测提供了有劲器具。形式地址:https://github.com/ssymmetry/BBT-FinCUGE-Applications

论文地址:https://arxiv.org/abs/2302.09432

金融界限评测基准:FLUE

FLUE,行为金融评测基准的新星,采集了5个金融界限数据集,为金融智能化评测提供了全新视角。形式地址:https://github.com/SALT-NLP/FLANG论文地址:https://arxiv.org/abs/2211.00083

五、两大训导界限引颈潮水的大模子

1、桃李 (Taoli)

该形式引颈了国外汉文训导界限的潮水,通过开源大模子,采集了500余册国外汉文训导课本与教辅书、汉语水平查验试题以及汉语学习者辞书等资源,构建了国外汉文训导资源库。全心联想的88000条高质料问答数据集,让模子在国外汉文训导场景中天真应用知识。

形式地址:https://github.com/blcuicall/taoli

2、EduChat

该形式在训导垂直界限展现出了超卓的对话能力,其大模子交融了各种化的训导资源,并通过指示微调、价值不雅对都等步调,为训导场景下的出题、功课改造、情谊支撑等提供了全面支撑。它奇迹于教师、学生和家长,勤勉于达成智能化、个性化的训导。

形式地址:https://github.com/icalk-nlp/EduChat

论文地址:https://arxiv.org/abs/2308.02773

六、自媒体界限的改进之作

1、MediaGPT

该形式展示了汉文自媒体界限的新锐力量,通过在大限制自媒体语料上进行预考验,系统地学习自媒体知识体系。借助ChatGPT等时刻,MediaGPT在抖音运营、短视频创作等界限展现出超卓的骨子应用能力。

形式地址:https://github.com/IMOSR/MediaGPT

七、电商界限的杰出人物

1、EcomGPT

该形式推出的电商大模子EcomGPT,凭借其出色的性能,在电商界限内脱颖而出。基于BLOOMZ在电商界限的指示微调数据集,EcomGPT在多个电商评测数据集上超越了ChatGPT,为电商界限带来了智能化的新体验。

形式地址:https://github.com/Alibaba-NLP/EcomGPT

论文地址:https://arxiv.org/abs/2308.06966

八、政务界限的灵敏采用

YaYi (雅意)

该形式推出的多界限大模子YaYi (雅意),凭借其百万级高质料界限数据和上百种当然言语指示任务,为媒体宣传、舆情分析、大家安全等界限提供了灵敏化的处分有推敲。

形式地址:https://github.com/wenge-research/YaYi

九、天文地舆界限的秀丽之星

1、StarGLM该形式慎重发布了天文大模子StarGLM,它依托于司天工程的丰富语料与知识库,经过精细考验而成。StarGLM的出身,旨在破解大言语模子在天文知识及前沿变星界限所濒临的挑战,从而进一步夯实了翌日在天文多模态任务中的基础,并为千里镜阵列中的司天大脑(数据智能处理系统)的部署铺平了谈路。

形式投降可拜访:https://github.com/Yu-Yang-Li/StarGLM

2、K2

K2,这款地球科学大模子,其灵感源于LLaMA,并玄妙地交融了地球科学文件与维基百科的精髓。进一步的指示微调,更是在GeoSignal数据集的柔润下得以达成。

形式相接:https://github.com/davendw49/k2

干系论文:https://arxiv.org/abs/2306.05064

天文地舆界限的秀丽之星——GeoGLUE

GeoGLUE,这一由阿里巴巴达摩院与高德联袂推出的地舆语义贯串评测基准,旨在燃烧地舆文本处理时刻的火花,鼓舞社区共荣。多个中枢场景被全心提真金不怕火,包括舆图搜索、电商物流、政府登记与金融交通等,每个场景都围绕六大中枢任务伸开:门址地址要素瓦解、地舆实体对都、Query-POI库调回、Query-POI干系性排序、地址Query身分分析以及WhereWhat切分。

形式投降:https://modelscope.cn/datasets/damo/GeoGLUE/summary

干系论文:https://arxiv.org/abs/2305.06545

十、交通界限的秀丽新星

1、TransGPT (致远)

TransGPT,这一交通界限的明星大模子,以“致远”为名,寓意深切。它深植于真正交通行业,勤勉于达成多种实勤奋能,包括交通情况揣摸、智能征询助手、大家交通奇迹、交通筹算联想、交通安全训导、协助经管、交通事故薪金与分析以及自动驾驶赞成系统等。TransGPT行为通用知识交通大模子,为谈路工程、桥梁工程、爽气工程、公路输送、水路输送、城市大家交通输送、交通输送经济、交通输送安全等行业提供了弘远的通识知识。以之为基石,不错天真利用于各种交通应用场景。

形式相接:https://github.com/DUOMO/TransGPT

十一、蚁集安全界限的防守者

1、AutoAudit

AutoAudit,这款蚁集安全大模子,犹如蚁集安全界限的防守者,以强壮的当然言语处理能力为安全审计和蚁集扎眼提供了坚实的后援。它具备分析坏心代码、检测蚁集迤逦、揣摸安全纰谬等能力,为安全专科东谈主员提供了不成或缺的支撑。

形式相接:https://github.com/ddzipp/AutoAudit

十二、科技前沿的两大模子

1、TechGPT

TechGPT,这款科研界限的巨星模子,后来劲与应用价值正徐徐被发掘。在翌日的科研谈路上,它将阐述出无可替代的作用。咱们庆幸地告示,咱们已到手开源了一款超卓的科技大模子——TechGPT。该模子专注于诡计机科学、材料、机械、冶金、金融及航空航天等十余种专科界限,深度集成了界限术语抽取、定名实体识别、关系三元组抽取等先进功能。不仅如斯,TechGPT还领有文本要害词生成、标题生成摘记、文才气域识别等当然言语贯串和生成能力,进一步拓展了其在机器阅读贯串、基础知识问答、基于高下文的知识问答等多个场景的应用。其出色的案牍生成、中英互译以及通俗代码生到手能,无疑将为科研东谈主员和时刻开发者提供极大的便利。

形式地址:https://github.com/neukg/TechGPT

2、开源科技论文大模子——Mozi(墨子)

这款模子专为科技文件问答和情谊分析联想,旨在为用户提供精确的文件解答与深入的情谊知悉。

形式地址:https://github.com/gmftbyGMFTBY/science-llm

论文地址:https://github.com/gmftbyGMFTBY/science-llm/blob/main/asset/mozi_technical_report.pdf

📏附:大模子数据集&评测基准汇总

C-Eval 

图片

申花不会拒绝费南多的到来,但也不会以“外援”的薪资标准去买进一个31岁,明年年初自由身32岁,状态一年一个坎的边锋,哪怕如今是国家队的主力。

1. 湘南丽海位于日本神奈川县,该队成立于1992年,历史上获得3次日职联冠军,2次日职乙冠军,1次天皇杯冠军,1次日联杯冠军,不过近年阵容平庸,扮演日职联和日职乙升降机的角色。

 [paper] 

图片

C-Eval是一个由上海交通大学发布的汉文基础模子评测基准,包含了13948个多项采用题,涵盖了东谈主文,社科,理工,其他专科四个大标的,52个学科,从中学到大学有计划生以及奇迹查验。

AGIEval 

图片

 [paper] 

图片

AGIEval是一个由微软发布的评测基准,用于评估大模子在东谈主类领略任务中的表示,包含了20个面向闲居考生的官方、公开、高圭臬入学和经验查验,包括闲居大学入学查验 (中国高考和好意思国SAT查验)、法学院入学查验、数学竞赛和讼师经验查验、国度公事员查验等。

Xiezhi (獬豸) 

图片

 [paper] 

图片

Xiezhi是一个由复旦大学发布的轮廓的、多学科的、大约自动更新的界限知识评测基准,包含了玄学、经济学、法学、训导学、文体、历史学、当然科学、工学、农学、医学、军事学、经管学、艺术学这13个学科门类,516个具体学科,249587谈题目。

CMMLU 

图片

 [paper] 

图片

CMMLU是一个轮廓性的汉文评测基准,挑升用于评估言语模子在汉文语境下的知识和推理能力。CMMLU涵盖了从基础学科到高等专科水平的67个主题。它包括:需要诡计和推理的当然科学,需要知识的东谈主文科学和社会科学,以及需要糊口知识的中国驾驶章程等。此外,CMMLU中的很多任务具有中国特定的谜底,可能在其他地区或言语中并不大量适用。因此是一个统统中国化的汉文测试基准。

MMCU 

图片

 [paper] 

图片

MMCU是一个轮廓性的汉文评测基准,包括来自医学、法律、心绪学和训导等四大界限的测试。

CG-Eval 

图片

 [paper] 

图片

CG-Eval是一个由甲骨易AI有计划院与LanguageX AI Lab鸠合发布的针对汉文大模子生成能力的评测基准。包含了科技与工程、东谈主文与社会科学、数学诡计、医生经验查验、司法查验、注册司帐师查验等六个大科目类别下的55个子科见解11000谈不同类型问题。CG-Eval包含一套复合的打分系统:关于非诡计题,每一起名词证实题和简答题都有圭臬参考谜底,收受多个圭臬打分然后加权乞降;关于诡计题目,会提真金不怕火最终诡计摈弃息争题过程,然后轮廓打分。

CBLUE 

图片

 [paper] 

图片

CBLUE是一个汉文医学言语贯串评测基准,包含8个汉文医疗言语理罢职务。

PromptCBLUE 

图片

 [paper] 

图片

PromptCBLUE是一个面向汉文医疗场景的评测基准,通过对CBLUE基准进行二次开发,将16种不同的医疗场景NLP任务全部转动为基于领导的言语生成任务。

LAiW 

图片

 [paper] 

图片

LAiW 是一个汉文法律大模子评测基准,针对3大能力联想13个基础任务:1)法律 NLP 基础能力:评测法律基础任务、 NLP 基础任务和法律信息抽取的能力,包括法条推送、要素识别、定名实体识别、司法重点摘记和案件识别 5 个基础任务;2)法律基础应用能力:评测大模子对法律界限知识的基础应用能力,包括争议焦点挖掘、类案匹配、刑事裁判揣摸、民事裁判揣摸和法律问答 5 个基础任务;3)法律复杂应用能力:评测大模子对法律界限知识的复杂应用能力,包括司法说理生成、案情贯串和法律征询 3 个基础任务。

LawBench 

图片

 [paper] 

图片

LawBench 是一个面向中司法律体系的法律评测基准。LawBench 模拟了司法领略的三个维度,并采用了20个任务来评估大模子的能力。与一些仅有多项采用题的现存基准比较,LawBench 包含了更多与推行寰球应用密切干系的任务类型,如法律实体识别、阅读贯串、违纪金额诡计和征询等。

LegalBench 

图片

 [paper] 

图片

LegalBench 是一个面向好意思司法律体系的法律评测基准,包含162个法律推理任务。

LEXTREME 

图片

 [paper] 

图片

LEXTREME是一个多言语的法律评测基准,包含了24种言语11个评测数据集。

LexGLUE 

图片

 [paper] 

图片

LexGLUE是一个英文法律评测基准。

CFBenchmark 

图片

 [paper] 

图片

CFBenchmark是一个旨在评估大言语模子在汉文金融场景下赞成责任的评测基准。CFBenchmark的基础版块包括3917个金融文本涵盖三个方面和八个任务,从金融识别、金融分类、金融生成三个方面进行组织。

FinanceBench 

图片

 [paper] 

图片

FinanceBench是一个用于评估绽开式金融问题问答的评测基准,包含 10,231 个揣摸上市公司的问题,以及相应的谜底。

FinEval 

图片

 [paper] 

图片

FinEval是一个金融知识评测基准,包含了4,661个高质料的多项采用题,涵盖金融、经济、司帐和文凭等界限,34个不同的学术科目。

FLARE 

图片

 [paper] 

图片

FLARE是一个金融评测基准,包含了金融知识贯串和揣摸等任务。

CFLEB 

图片

 [paper] 

图片

CFLEB是一个汉文金融评测基准,包含两项言语生成任务和四项言语理罢职务。

FLUE 

图片

 [paper] 

图片

FLUE是一个金融评测基准,包含5个金融界限数据集。

GeoGLUE [paper] 

图片

GeoGLUE是一个由阿里巴巴达摩院与高德鸠合发布的地舆语义贯串能力评测基准,旨在鼓舞地舆干系文本处理时刻和社区的发展。本榜单提真金不怕火了其中多个典型场景:舆图搜索、电商物流、政府登记、金融交通,并联想了六个中枢任务:门址地址要素瓦解、地舆实体对都、Query-POI库调回、Query-POI干系性排序、地址Query身分分析、WhereWhat切分。

OWL-Bench 

图片

 [paper] 

图片

OWL-Bench 是一个面向运维界限的双语评测基准。它包含 317 个问答题和 1000 个多选题,涵盖了该界限的无边推行工业场景,包括信息安全、应用、系统架构、软件架构、中间件、蚁集、操作系统、基础体式和数据库这九个不同的子界限。以确保 OWL-Bench 大约展现出各种性。

DevOps-Eval 

图片

 

图片

DevOps-Eval是由蚂麇集团鸠合北京大学发布的面向DevOps界限的大言语模子评测基准。

回来

本文全面概述了现时垂直界限模子与评测基准,涵盖了12个界限,57个界限微调模子,并配备了丰富的评测数据集,以供各界参考与模仿。

图片

参考文件

1、https://github.com/luban-agi/Awesome-Domain-LLM小程序开发价格

本站仅提供存储奇迹,悉数内容均由用户发布,如发现存害或侵权内容,请点击举报。
服务热线
官方网站:gubiw.cn
工作时间:周一至周六(09:00-18:00)
联系我们
QQ:2852320325
邮箱:w365jzcom@qq.com
地址:武汉东湖新技术开发区光谷大道国际企业中心
关注公众号

Powered by 小程序开发价钱 RSS地图 HTML地图

Copyright Powered by365站群 © 2013-2024 云迈科技 版权所有