CG

CareGPT

医疗 & 生命科学开源zh/enNon-commercial

模型简介

CareGPT 是一个聚合了数十个公开医疗微调数据集的训练框架。它支持增量预训练、SFT 和 RLHF/DPO,适合二次开发。

不同于单一的模型,CareGPT 更像是一个医疗大模型训练平台。它整合了国内外多个高质量的医疗数据集,提供了标准化的训练流程,方便研究人员基于此开发自己的医疗模型。

应用场景

  • 医疗模型训练
  • 学术研究
  • 二次开发

核心优势

  • 开源可用:模型权重完全开放,支持本地部署和二次开发,降低了技术门槛和使用成本。
  • 数据安全:可在私有环境中运行,确保敏感数据不外泄,满足行业合规要求。
  • 专业领域知识:在医学文献和临床数据上进行了专门的训练,具备深厚的医学知识储备。
  • 安全性保障:遵循医疗行业的数据隐私和安全规范,确保患者信息的安全。
  • 国产基座:基于通义千问系列,中文理解能力出色,国产化适配友好。

资源链接

常见问题

什么是CareGPT?

CareGPT 是一个聚合了数十个公开医疗微调数据集的训练框架。它支持增量预训练、SFT 和 RLHF/DPO,适合二次开发。 不同于单一的模型,CareGPT 更像是一个医疗大模型训练平台。它整合了国内外多个高质量的医疗数据集,提供了标准化的训练流程,方便研究人员基于此开发自己的医疗模型。

CareGPT是什么类型的大模型?

CareGPT是由Community开发的医疗 & 生命科学领域开源模型,基于LLaMA / ChatGLM / Qwen架构。

CareGPT有哪些应用场景?

医疗模型训练、学术研究、二次开发

如何使用CareGPT?

可以通过https://github.com/WangRongsheng/CareGPT访问官网获取使用方式。