色情片 太强了!各个行业的AI大模子!金融、诠释、医疗、法律..
一、医疗鸿沟大模子色情片
1、DoctorGLM
基于ChatGLM-6B的不凡汉文问诊模子,它和会了海量的汉文医疗对话数据集进行精确微调,采取lora、p-tuningv2等前沿时间闭幕高效部署。
模样地址:https://github.com/xionghonglin/DoctorGLM
论文地址:https://arxiv.org/abs/2304.01097
2、BenTsao (本草)
该模样集大成者,开源了多款经过汉文医学指示微调的大谈话模子,涵盖LLaMA、Alpaca-Chinese、Bloom等,皆以医学知识图谱和医学文件为基础,勾通ChatGPT API全心打造,闭幕了汉文医学指示微调数据集的精确教师,极大擢升了医疗鸿沟问答的准确性与实用性。
模样地址:https://github.com/SCIR-HI/Huatuo-Llama-Med-Chinese
论文地址:https://arxiv.org/abs/2304.06975
3、Med-ChatGLM
该模样相同基于汉文医学指示微调,对ChatGLM-6B模子进行了深度优化,微调数据与BenTsao模样全始全终,确保了模子在医疗鸿沟的不凡线路。
模样地址:https://github.com/SCIR-HI/Med-ChatGLM
4、BianQue (扁鹊)
该模样草创性地推出了生计空间健康大模子,深度整合了面前开源的汉文医疗问答数据集,勾通自建的生计空间健康对话大数据,构建了千万级别的扁鹊健康大数据BianQueCorpus,基于此全心打造了ChatGLM-6B为运转换的BianQue模子,全面擢升了模子在医疗与健康鸿沟的应用价值。
模样地址:https://github.com/scutcyr/BianQue
5、HuatuoGPT (华佗)
该模样大力推出医疗大模子HuatuoGPT,其中包括了基于Baichuan-7B教师的HuatuoGPT-7B与基于Ziya-LLaMA-13B-Pretrain-v1的HuatuoGPT-13B,旨在提供全所在、高措施的医疗智能管事。
模样地址:https://github.com/FreedomIntelligence/HuatuoGPT
论文地址:https://arxiv.org/abs/2305.15075
6、QiZhenGPT该模样通过启真医学知识库的精妙愚弄,构建了依样葫芦的汉文医学指示数据集,进一步在Chinese-LLaMA-Plus-7B、CaMA-13B、ChatGLM-6B等顶端模子上全心调动指示,权贵擢升了模子在汉文医疗环境中的实用效果。
模样地址:https://github.com/CMKRG/QiZhenGPT
7、ChatMed
该模样改变性地发布了汉文医疗大模子ChatMed-Consult,以ChatMed_Consult_Dataset中卓绝50万的汉文医疗在线问诊数据及ChatGPT的精确回答看成教师基石,基于LlaMA-7b并通过LoRA时间进行了细巧微调。
模样地址:https://github.com/michael-wzhu/ChatMed
8、ShenNong-TCM-LLM(神农)
该模样推出了汉文中医药鸿沟的隆起模子ShenNong-TCM-LLM,以中医药知识图谱为基础,愚弄实体为中枢的自指示阵势,通过ChatGPT生成了丰富的2.6万+中医药指示数据集ChatMed_TCM_Dataset,再基于LlaMA底座,借助LoRA时间进行了精确微调。
模样地址:https://github.com/michael-wzhu/ShenNong-TCM-LLM
9、XrayGLM
该模样草创了汉文多模态医学数据集与模子的先河,尤其在医学影像会诊与多轮交互对话中展现出不凡的潜能。
模样地址:https://github.com/WangRongsheng/XrayGLM
10、MedicalGPT
该模样无垠推出了医疗大模子MedicalGPT,集成了增量预教师、有监督微调、RLHF(奖励建模、强化学习教师)和DPO(平直偏好优化)等前沿时间。
模样地址:https://github.com/shibing624/MedicalGPT
11、Sunsimiao(孙想邈)
该模样推出了汉文医疗大模子Sunsimiao,该模子以baichuan-7B和ChatGLM-6B为坚实底座,在数十万条高质地的汉文医疗数据中进行了全心微调。
模样地址:https://github.com/thomas-yanxin/Sunsimiao
12、CareLlama(眷注羊驼)
模样地址:https://github.com/itsharex/CareLlama
该模样推出了医疗大模子CareLlama,并网罗了数十个公开可用的医疗微调数据集和洞开可用的医疗大谈话模子,旨在为医疗LLM的快速发展注入强盛能源。
13、DISC-MedLLM
该模样由复旦大学发布,针对医疗健康对话式场景全心联想了医疗鸿沟大模子与数据集。模子通过DISC-Med-SFT数据集在Baichuan-13B-Base基础上进行指示微调,灵验匹配了医疗场景下的东说念主类偏好,消弱了通用谈话模子输出与的确天下医疗对话之间的差距。模样地址:https://github.com/FudanDISC/DISC-MedLLM
论文地址:https://arxiv.org/abs/2308.14346
14、PMC-LLaMA
本模样公开了前沿的医疗大模子PMC-LLaMA,其中包含MedLLaMA_13B预教师版块与PMC_LLaMA_13B指示微调版块,为医疗鸿沟带来了更正的时间冲突。
模样地址:https://github.com/chaoyi-wu/PMC-LLaMA
论文地址:https://arxiv.org/abs/2304.14454
15、ChatDoctor
ChatDoctor,一款基于LLaMA教师的医疗大模子,其开源特质让更多东说念主省略恍悟医疗科技的魔力。
模样地址:https://github.com/Kent0n-Li/ChatDoctor
论文地址:https://arxiv.org/abs/2303.14070
16、MING (明医)
模样地址:https://github.com/189569400/MedicalGPT-zh
MING,一个基于bloomz-7b指示微调而成的医疗大模子,其不凡的性能在医疗问答、智能问诊等方面得到了充分体现。
17、IvyGPT
IvyGPT,一款医疗大模子,经过高质地的医学问答数据监督微调处东说念主类响应强化学习教师,展现了出色的智能医疗处奢睿力。
模样地址:https://github.com/WangRongsheng/IvyGPT
18、PULSE
本模样开源了汉文医疗大模子PULSE,该模子采取约4,000,000个汉文医学与通用鸿沟指示微调数据进行优化,复古平凡的医疗鸿沟当然谈话处理任务,包括健康诠释、医生覆按问题解答、回报解读、医疗记载结构化以及模拟会诊和调治等。
模样地址:https://github.com/openmedlab/PULSE
19、HuangDI (天子)
HuangDI,一款中医大模子,其私有之处在于和会了中医课本、网站数据与Ziya-LLaMA-13B-V1基座模子,打造出具有深厚中医知识意会力的预教师模子,并通过海量中医古籍指示对话数据与通用指示数据进行微调,闭幕中医古籍知识问答的精确智力。
模样地址:https://github.com/Zlasejd/HuangDI
20、ZhongJing (仲景)
ZhongJing,一个旨在传承中医精髓与当代时间相勾通的中医大模子。该模样不仅发达了中医的博大深通,还通过当代时间改变,为医学鸿沟提供了实在赖和专科的用具,是中医与AI和会的隆起代表。模样地址:https://github.com/pariskang/CMLM-ZhongJing
21、TCMLLM
该模样旨在通过大型模子时间,闭幕中医临床接济诊疗(包括病证会诊、处方推选等)以及中医药知识问答等多项任务,引颈中医知识问答与临床接济诊疗等鸿沟的飞跃性跳跃。面前,咱们已针对中医临床智能诊疗中的处方推选问题,发布了TCMLLM-PR这一中医处方推选大模子。该模子通过整合的确天下的临床病历、医学文籍与中医教科书等海量数据,全心构建了包含68k数据条件标处方推选指示微调数据集,并在ChatGLM大模子上进行深度优化与微调。
模样地址:https://github.com/2020MEAI/TCMLLM
22、OpenBioMed
该模样勉力于开源多模态生物医学大模子,涵盖了BioMedGPT这一多模态生物医药大模子、DrugFM和MolFM等多模态小分子基础模子,以及CellLM等细胞默示学习模子。
模样地址:https://github.com/PharMolix/OpenBioMed
论文地址:https://arxiv.org/abs/2308.09442
PromptCBLUE医疗评测基准
PromptCBLUE是一个针对汉文医疗场景的评测基准,通过二次缔造CBLUE基准,将16种不同的医疗场景NLP任务全面转换为基于辅导的谈话生成任务,为汉文医疗鸿沟的考虑提供了有劲的复古。
模样地址:https://github.com/michael-wzhu/PromptCBLUE
论文地址:https://arxiv.org/abs/2308.04823
汉文医疗模子评估基准CMB
A Comprehensive Medical Benchmark in Chinese(CMB)是一项详尽性的汉文医疗模子评估基准,它涵盖了不同临床奇迹、不同奇迹阶段覆按中的多项取舍题(CMB-Exam)以及基于的确病例的复杂临床会诊问题(CMB-Clin),为汉文医疗模子的评估提供了全面的参考。
论文地址:https://arxiv.org/abs/2308.08833
模样地址:https://github.com/FreedomIntelligence/CMB
二、4大心思健康鸿沟大模子1、MeChat
该模样勉力于开源汉文心思健康复古对话大模子与数据集。该模子基于ChatGLM-6B LoRA 16-bit指示进行了细巧的微调。同期,咱们通过ChatGPT时间将的确的心思配合QA改写为多轮的心思健康复古多轮对话,构建了含有56k个多轮对话的丰富数据集。该数据集的主题、词汇和篇章语义丰富各类,相等适用于长程多轮对话的应用场景。
模样地址:https://github.com/qiuhuachuan/smile
**2、SoulChat (灵心)**该模样开源了心思健康大模子SoulChat(灵心)。该模子源于ChatGLM-6B的深厚底蕴,经过百万限度心思商议鸿沟的汉文长文本指示与多轮共情对话数据的全心微调,得以出生。它不单是是一个模子,更是东说念主们心灵的看护者,静静倾听,深心意会。
模样地址:https://github.com/scutcyr/SoulChat
3、MindChat(闲谈)
这一模样勉力于开源心思大模子MindChat。经过东说念主工全心清洗的约20万条高质地多轮心思对话数据,涵盖了职责、家庭、学习、生计、外交、安全等多个层面,为模子的教师提供了丰富的素材。MindChat盼望从心思商议、心思评估、心思会诊、心思调治四个维度,为东说念主们带来心灵的慰藉与解放,擢升全体的心思健康水平。
模样地址:https://github.com/X-D-Lab/MindChat
4、QiaoBan(巧板)
在儿童心情陪同鸿沟,QiaoBan这一儿童心情对话大模子应时而生。它基于开源通用大模子,和会了通用域东说念主机对话、单轮指示数据以及专为儿童联想的心情陪同对话数据,经过全心微调,最终酿成了这款专为儿童量身打造的心情陪同大模子。
模样地址:https://github.com/HIT-SCIR-SC/QiaoBan
三、10大法律鸿沟微调模子及2大评测基准1、LawGPT_zh(獬豸)
这一汉文法律通用模子源自ChatGLM-6B与LoRA 16-bit指示的全心和会。数据集方面,模样团队不仅利用了现存的法律问答数据集,更通过self-Instruct时间,基于法条和的确案例构建了高质地的法律文本问答数据,大幅擢升了模子在法律鸿沟的线路,确保了回答的专科性和可靠性。
模样地址:https://github.com/LiuHC0428/LAW-GPT
2、LaWGPT
LaWGPT系列模子在通用汉文基座模子的基础上,增添了法律鸿沟的专有词表和大限度汉文法律语料,极地面增强了模子在法律鸿沟的基础语义意会智力。勾通法律鸿沟对话问答数据集、中国司法覆按数据集的指示精调,LaWGPT对法律内容的意会和推论智力得到了权贵擢升。
模样地址:https://github.com/pengxiao-song/LaWGPT
3、LexiLaw色情片
LexiLaw,这一汉文法律大模子,以ChatGLM-6B为架构基础,经过法律鸿沟数据的全心微调,使得其在法律商议与复古方面展现出不凡的性能和专科性。不管是法律从业者、学生还是浅显用户,LexiLaw都能为他们提供准确、可靠的法律商议管事,助力他们在法律问题的海洋中乘风破浪。
模样地址:https://github.com/CSHaitao/LexiLaw
4、Lawyer LLaMA
这一模样开源了法律鸿沟的指示微调数据和基于LLaMA教师的汉文法律大模子Lawyer LLaMA。Lawyer LLaMA以其不凡的性能和深度,为法律鸿沟带来了前所未有的改变与冲突。LLaMA经过大限度法律语料库的预教师,深入系统地学习了中国的法律知识体系。在此基石之上,咱们借助ChatGPT的奢睿,征集了一系列针对中国国度袪除法律奇迹阅历覆按客不雅题的分析和法律商议的回答,并通过对这些顾惜数据的指示微调,使模子具备了将法律知识机动应用于各式具体场景的智力。
探索征服,请打听模样地址:https://github.com/AndrewZhe/lawyer-llama
深入研读,可打听论文地址:https://arxiv.org/abs/2305.15062
5、HanFei (韩非)
HanFei-1.0看成国内首个全参数教师的法律大模子,领有高达7b的参数目,其功能涵盖法律问答、多轮对话、著作撰写、检索等多元化需求。
模样地址:https://github.com/siat-nlp/HanFei
6、ChatLaw
北京大学开源的法律大模子系列——ChatLaw,依托海量的法律新闻、论坛、法条、司法解释、法律商议、法考题及判决通知等原始文本,构建了丰富的对话数据。ChatLaw-13B和ChatLaw-33B即是基于姜子牙-13B、Anima-33B的不凡教师效果。同期,ChatLaw-Text2Vec更是利用93万条判决案例,基于BERT教师出相似度匹配模子,精确匹配用户发问与对应法条。
模样地址:https://github.com/PKU-YuanGroup/ChatLaw
论文地址:https://arxiv.org/abs/2306.16092
7、Lychee (律知)
咱们开源了基于GLM-10B模子的汉文司法鸿沟大模子Law-GLM-10B,经过30GB汉文法律数据的指示微调,展现出不凡的司法鸿沟应用智力。
模样地址:https://github.com/davidpig/lychee_law
8、wisdomInterrogatory (智海-录问)
由浙江大学、阿里巴巴达摩院及华院辩论联袂打造的法律大模子,该模子基于Baichuan-7B进行了法律鸿沟数据的深度预教师与指示微调,并依样葫芦肠联想了知识增强的推理过程。
模样地址:https://github.com/zhihaiLLM/wisdomInterrogatory
9、JurisLMs
该模样基于丰富的汉文法学语料库,全心教师了一系列法律鸿沟的谈话模子,包括:
AI Judge——一款可解释的法律判决琢磨模子,由GPT2在法学语料上深化预教师,并勾通法条适用模子(基于BERT的分类器)微调而成,不仅能精确琢磨判决截止,更能禀报法院的审理不雅点;
AI Lawyer——一款智能法律商议模子,通过主动学习在有限的数据上进行精眇小调,省略针对用户商议,精确匹配并应用相应的法律端正进行回答。
模样地址:https://github.com/seudl/JurisLMs
10、夫子·洞察司法大模子
该模子汇聚了法律鸿沟的奢睿,勉力于司法鸿沟的深度应用与探索。以ChatGLM为基石,咱们全心构建了一个汉文司法大模子,它依托海量的汉文无监督司法语料与精确的有监督司法微调数据。这款模子功能丰富,涵盖法条检索、案例分析、三段论推理判决以及司法对话等,勉力于为用户提供全面且精确的法律商议与解答管事。
模样地址:https://github.com/irlab-sdu/fuzi.mingcha
在法律评测鸿沟,LEXTREME看成一个多谈话的法律评测基准,隐私24种谈话,领有11个评测数据集,其巨擘性和全面性备受认同。
模样地址:https://github.com/JoelNiklaus/LEXTREME
论文地址:https://arxiv.org/abs/2301.13126
另一法律评测基准LexGLUE,专注于英文法律评测,以其私有的视角和深度在业界获取了平凡认同。
模样地址:https://github.com/coastalcph/lex-glue
论文地址:https://arxiv.org/abs/2110.00976
四、10大金融鸿沟微调模子及3大评测基准1、BBT-FinCUGE-Applications
该模样不仅开源了汉文金融鸿沟语料库BBT-FinCorpus,还推出了知识增强型大模子BBT-FinT5及评测基准CFLEB,展现了其在金融鸿沟的深厚累积。
论文地址:https://arxiv.org/abs/2302.09432
模样地址:https://github.com/ssymmetry/BBT-FinCUGE-Applications
2、Cornucopia (聚宝盆)
该模样凭借对公开和爬取的汉文金融鸿沟问答数据的深入挖掘,构建了私有的指示数据集,并对LLaMA系模子进行了精确指示微调,权贵擢升了模子在金融鸿沟的问答效果。
模样地址:https://github.com/jerry1993-tech/Cornucopia-LLaMA-Fin-Chinese
3、XuanYuan (轩辕)
看成国内首个开源的千亿级汉文对话大模子,轩辕更是针对汉文金融鸿沟进行了深度优化。它基于BLOOM-176B进行了针对性预教师与微调,既能处理通用鸿沟问题,又能提供全面且准确的金融信息与提倡。
模样地址:https://github.com/Duxiaoman-DI/XuanYuan
论文地址:https://arxiv.org/abs/2305.12002
4、PIXIU (貔貅)模样地址:https://github.com/chancefocus/PIXIU
五月激情论文地址:https://arxiv.org/abs/2306.05443 本模样公开了金融鸿沟的指示微调数据集FIT,以及大型模子FinMA与评估基准FLARE,为金融鸿沟注入了智能化新能源。
5、FinGPT
本模样孝顺了多个金融鸿沟的大模子,涵盖ChatGLM2-6B+LoRA和LLaMA2-7B+LoRA等,并网罗了金融新闻、外交媒体、财报等多维度中英文教师数据。模样地址:https://github.com/AI4Finance-Foundation/FinGPT
论文地址:https://arxiv.org/abs/2306.06031
6、FLANG
本模样倾力打造了金融大模子FLANG,为金融行业的智能化发展再添新翼。模样地址:https://github.com/SALT-NLP/FLANG
论文地址:https://arxiv.org/abs/2211.00083
10、FinEval
FinEval,一个专注于金融知识的评测基准,汇聚了4,661说念高质地多项取舍题,隐私金融、经济、司帐、文凭等多个鸿沟,波及34个不同学术科目。模样地址:https://github.com/SUFE-AIFLM-Lab/FinEval
论文地址:https://arxiv.org/abs/2308.09975
金融鸿沟评测基准:FLARE
FLARE,一个专为金融鸿沟打造的评测基准,它涵盖了金融知识意会和琢磨等任务,助力金融行业智能化发展。模样地址:https://github.com/chancefocus/PIXIU
论文地址:https://arxiv.org/abs/2306.05443
金融鸿沟评测基准:CFLEB
CFLEB,一个面向汉文金融鸿沟的评测基准,包含了谈话生成与意会的多项任务,为汉文金融鸿沟智能化评测提供了有劲用具。模样地址:https://github.com/ssymmetry/BBT-FinCUGE-Applications
论文地址:https://arxiv.org/abs/2302.09432
金融鸿沟评测基准:FLUE
FLUE,看成金融评测基准的新星,网罗了5个金融鸿沟数据集,为金融智能化评测提供了全新视角。模样地址:https://github.com/SALT-NLP/FLANG论文地址:https://arxiv.org/abs/2211.00083
五、两大诠释鸿沟引颈潮水的大模子1、桃李 (Taoli)
该模样引颈了海外汉文诠释鸿沟的潮水,通过开源大模子,网罗了500余册海外汉文诠释课本与教辅书、汉语水平覆按试题以及汉语学习者辞书等资源,构建了海外汉文诠释资源库。全心联想的88000条高质地问答数据集,让模子在海外汉文诠释场景中机动应用知识。
模样地址:https://github.com/blcuicall/taoli
2、EduChat
该模样在诠释垂直鸿沟展现出了不凡的对话智力,其大模子和会了各类化的诠释资源,并通过指示微调、价值不雅对王人等阵势,为诠释场景下的出题、功课点窜、心情复古等提供了全面复古。它管事于教师、学生和家长,勉力于闭幕智能化、个性化的诠释。
模样地址:https://github.com/icalk-nlp/EduChat
论文地址:https://arxiv.org/abs/2308.02773
六、自媒体鸿沟的改变之作1、MediaGPT
该模样展示了汉文自媒体鸿沟的新锐力量,通过在大限度自媒体语料上进行预教师,系统地学习自媒体知识体系。借助ChatGPT等时间,MediaGPT在抖音运营、短视频创作等鸿沟展现出不凡的本色应用智力。
模样地址:https://github.com/IMOSR/MediaGPT
七、电商鸿沟的杰出人物1、EcomGPT
该模样推出的电商大模子EcomGPT,凭借其出色的性能,在电商鸿沟内脱颖而出。基于BLOOMZ在电商鸿沟的指示微调数据集,EcomGPT在多个电商评测数据集上超越了ChatGPT,为电商鸿沟带来了智能化的新体验。
模样地址:https://github.com/Alibaba-NLP/EcomGPT
论文地址:https://arxiv.org/abs/2308.06966
八、政务鸿沟的奢睿取舍YaYi (雅意)
该模样推出的多鸿沟大模子YaYi (雅意),凭借其百万级高质地鸿沟数据和上百种当然谈话指示任务,为媒体宣传、舆情分析、巨匠安全等鸿沟提供了奢睿化的处置决议。
模样地址:https://github.com/wenge-research/YaYi
九、天文地舆鸿沟的妍丽之星1、StarGLM该模样庄重发布了天文大模子StarGLM,它依托于司天工程的丰富语料与知识库,经过精细教师而成。StarGLM的出生,旨在破解大谈话模子在天文知识及前沿变星鸿沟所濒临的挑战,从而进一步夯实了以前在天文多模态任务中的基础,并为千里镜阵列中的司天大脑(数据智能处理系统)的部署铺平了说念路。
模样征服可打听:https://github.com/Yu-Yang-Li/StarGLM
2、K2
K2,这款地球科学大模子,其灵感源于LLaMA,并奥妙地和会了地球科学文件与维基百科的精髓。进一步的指示微调,更是在GeoSignal数据集的津润下得以闭幕。
模样聚合:https://github.com/davendw49/k2
联系论文:https://arxiv.org/abs/2306.05064
天文地舆鸿沟的妍丽之星——GeoGLUE
GeoGLUE,这一由阿里巴巴达摩院与高德联袂推出的地舆语义意会评测基准,旨在燃烧地舆文本处理时间的火花,股东社区共荣。多个中枢场景被全心提真金不怕火,包括舆图搜索、电商物流、政府登记与金融交通等,每个场景都围绕六大中枢任务张开:门址地址要素成见、地舆实体对王人、Query-POI库调回、Query-POI联系性排序、地址Query身分分析以及WhereWhat切分。
模样征服:https://modelscope.cn/datasets/damo/GeoGLUE/summary
联系论文:https://arxiv.org/abs/2305.06545
十、交通鸿沟的妍丽新星1、TransGPT (致远)
TransGPT,这一交通鸿沟的明星大模子,以“致远”为名,寓意久了。它深植于的确交通行业,勉力于闭幕多种实勤恳能,包括交通情况琢磨、智能商议助手、巨匠交通管事、交通联想联想、交通安全诠释、协助料理、交通事故回报与分析以及自动驾驶接济系统等。TransGPT看成通用学问交通大模子,为说念路工程、桥梁工程、纯正工程、公路运载、水路运载、城市巨匠交通运载、交通运载经济、交通运载安全等行业提供了广宽的通识知识。以之为基石,不错机动愚弄于各式交通应用场景。
模样聚合:https://github.com/DUOMO/TransGPT
十一、采集安全鸿沟的看护者1、AutoAudit
AutoAudit,这款采集安全大模子,犹如采集安全鸿沟的看护者,以康健的当然谈话处奢睿力为安全审计和采集把稳提供了坚实的后援。它具备分析坏心代码、检测采集报复、琢磨安全粗放等智力,为安全专科东说念主员提供了不成或缺的复古。
模样聚合:https://github.com/ddzipp/AutoAudit
十二、科技前沿的两大模子1、TechGPT
TechGPT,这款科研鸿沟的巨星模子,自后劲与应用价值正逐渐被发掘。在以前的科研说念路上,它将证明出无可替代的作用。咱们行运地晓谕,咱们已告捷开源了一款不凡的科技大模子——TechGPT。该模子专注于辩论机科学、材料、机械、冶金、金融及航空航天等十余种专科鸿沟,深度集成了鸿沟术语抽取、定名实体识别、关系三元组抽取等先进功能。不仅如斯,TechGPT还领有文本要津词生成、标题生成摘抄、文智力域识别等当然谈话意会和生成智力,进一步拓展了其在机器阅读意会、基础学问问答、基于坎坷文的知识问答等多个场景的应用。其出色的案牍生成、中英互译以及简便代码生告捷能,无疑将为科研东说念主员和时间缔造者提供极大的便利。
模样地址:https://github.com/neukg/TechGPT
2、开源科技论文大模子——Mozi(墨子)
这款模子专为科技文件问答和心情分析联想,旨在为用户提供精确的文件解答与深入的心情瞻念察。
模样地址:https://github.com/gmftbyGMFTBY/science-llm
论文地址:https://github.com/gmftbyGMFTBY/science-llm/blob/main/asset/mozi_technical_report.pdf
📏附:大模子数据集&评测基准汇总C-Eval
图片
[paper]图片
C-Eval是一个由上海交通大学发布的汉文基础模子评测基准,包含了13948个多项取舍题,涵盖了东说念主文,社科,理工,其他专科四个大所在,52个学科,从中学到大学考虑生以及奇迹覆按。
AGIEval
图片
[paper]图片
AGIEval是一个由微软发布的评测基准,用于评估大模子在东说念主类阐明任务中的线路,包含了20个面向浅显考生的官方、公开、高措施入学和阅历覆按,包括浅显大学入学覆按 (中国高考和好意思国SAT覆按)、法学院入学覆按、数学竞赛和讼师阅历覆按、国度公事员覆按等。
Xiezhi (獬豸)
图片
[paper]图片
Xiezhi是一个由复旦大学发布的详尽的、多学科的、省略自动更新的鸿沟知识评测基准,包含了形而上学、经济学、法学、诠释学、文体、历史学、当然科学、工学、农学、医学、军事学、料理学、艺术学这13个学科门类,516个具体学科,249587说念题目。
CMMLU
图片
[paper]图片
CMMLU是一个详尽性的汉文评测基准,挑升用于评估谈话模子在汉文语境下的知识和推奢睿力。CMMLU涵盖了从基础学科到高档专科水平的67个主题。它包括:需要辩论和推理的当然科学,需要知识的东说念主文科学和社会科学,以及需要生计学问的中国驾驶章程等。此外,CMMLU中的好多任务具有中国特定的谜底,可能在其他地区或谈话中并不大都适用。因此是一个齐全中国化的汉文测试基准。
MMCU
图片
[paper]图片
MMCU是一个详尽性的汉文评测基准,包括来自医学、法律、心思学和诠释等四大鸿沟的测试。
CG-Eval
图片
[paper]图片
CG-Eval是一个由甲骨易AI考虑院与LanguageX AI Lab合资发布的针对汉文大模子生成智力的评测基准。包含了科技与工程、东说念主文与社会科学、数学辩论、医生阅历覆按、司法覆按、注册司帐师覆按等六个大科目类别下的55个子科目标11000说念不同类型问题。CG-Eval包含一套复合的打分系统:关于非辩论题,每沿途名词解释题和简答题都有措施参考谜底,采取多个措施打分然后加权乞降;关于辩论题目,会索要最终辩论截止妥协题过程,然后详尽打分。
CBLUE
图片
[paper]图片
CBLUE是一个汉文医学谈话意会评测基准,包含8个汉文医疗谈话理撤职务。
PromptCBLUE
图片
[paper]图片
PromptCBLUE是一个面向汉文医疗场景的评测基准,通过对CBLUE基准进行二次缔造,将16种不同的医疗场景NLP任务全部转换为基于辅导的谈话生成任务。
LAiW
图片
[paper]图片
LAiW 是一个汉文法律大模子评测基准,针对3大智力联想13个基础任务:1)法律 NLP 基础智力:评测法律基础任务、 NLP 基础任务和法律信息抽取的智力,包括法条推送、要素识别、定名实体识别、司法重心摘抄和案件识别 5 个基础任务;2)法律基础应用智力:评测大模子对法律鸿沟知识的基础应用智力,包括争议焦点挖掘、类案匹配、刑事裁判琢磨、民事裁判琢磨和法律问答 5 个基础任务;3)法律复杂应用智力:评测大模子对法律鸿沟知识的复杂应用智力,包括司法说理生成、案心意会和法律商议 3 个基础任务。
LawBench
图片
[paper]图片
LawBench 是一个面向中抓法律体系的法律评测基准。LawBench 模拟了司法阐明的三个维度,并取舍了20个任务来评估大模子的智力。与一些仅有多项取舍题的现存基准比拟,LawBench 包含了更多与践诺天下应用密切联系的任务类型,如法律实体识别、阅读意会、监犯金额辩论和商议等。
LegalBench
图片
[paper]图片
LegalBench 是一个面向好意思抓法律体系的法律评测基准,包含162个法律推理任务。
LEXTREME
图片
[paper]图片
LEXTREME是一个多谈话的法律评测基准,包含了24种谈话11个评测数据集。
LexGLUE
图片
[paper]图片
LexGLUE是一个英文法律评测基准。
CFBenchmark
图片
[paper]图片
CFBenchmark是一个旨在评估大谈话模子在汉文金融场景下接济职责的评测基准。CFBenchmark的基础版块包括3917个金融文本涵盖三个方面和八个任务,从金融识别、金融分类、金融生成三个方面进行组织。
FinanceBench
图片
[paper]图片
FinanceBench是一个用于评估洞开式金融问题问答的评测基准,包含 10,231 个联系上市公司的问题,以及相应的谜底。
FinEval
图片
[paper]图片
FinEval是一个金融知识评测基准,包含了4,661个高质地的多项取舍题,涵盖金融、经济、司帐和文凭等鸿沟,34个不同的学术科目。
FLARE
图片
[paper]图片
FLARE是一个金融评测基准,包含了金融知识意会和琢磨等任务。
CFLEB
图片
[paper]图片
CFLEB是一个汉文金融评测基准,包含两项谈话生成任务和四项谈话理撤职务。
FLUE
图片
[paper]图片
FLUE是一个金融评测基准,包含5个金融鸿沟数据集。
GeoGLUE [paper]
图片
GeoGLUE是一个由阿里巴巴达摩院与高德合资发布的地舆语义意会智力评测基准,旨在股东地舆联系文本处理时间和社区的发展。本榜单提真金不怕火了其中多个典型场景:舆图搜索、电商物流、政府登记、金融交通,并联想了六个中枢任务:门址地址要素成见、地舆实体对王人、Query-POI库调回、Query-POI联系性排序、地址Query身分分析、WhereWhat切分。
OWL-Bench
图片
[paper]图片
OWL-Bench 是一个面向运维鸿沟的双语评测基准。它包含 317 个问答题和 1000 个多选题,涵盖了该鸿沟的繁密践诺工业场景,包括信息安全、应用、系统架构、软件架构、中间件、采集、操作系统、基础门径和数据库这九个不同的子鸿沟。以确保 OWL-Bench 省略展现出各类性。
DevOps-Eval
图片
图片
DevOps-Eval是由蚂汇注团合资北京大学发布的面向DevOps鸿沟的大谈话模子评测基准。
追念本文全面概述了面前垂直鸿沟模子与评测基准,涵盖了12个鸿沟,57个鸿沟微调模子,并配备了丰富的评测数据集,以供各界参考与模仿。
图片
参考文件1、https://github.com/luban-agi/Awesome-Domain-LLM色情片
本站仅提供存储管事,所有这个词内容均由用户发布,如发现存害或侵权内容,请点击举报。