Web前端开发网

web.fly63.com

首页 资源 工具 文章 教程 栏目
  • 在线搜索
  • 文章标签
  • 文章投稿
  • 关于我们

资源分类

AI智能 酷站推荐 招聘/兼职 框架/库 模块/管理 移动端UI框架 Web-UI框架 Js插件 Jquery插件 CSS相关 IDE环境 在线工具 图形动效 游戏框架 node相关 调试/测试 在线学习 社区/论坛 博客/团队 前端素材 图标/图库 建站资源 设计/灵感 IT资讯
网站收录 / 问题反馈

Firefly(流萤)

分享
复制链接
新浪微博
QQ 好友

扫一扫分享

GitHub:https://github.com/yangjianxin1/Firefly
描述信息:中文对话式大语言模型
GitHub

Firefly(流萤): 中文对话式大语言模型(全量微调+QLoRA),支持微调Mixtral-8x7B、Zephyr、Mistral、Aquila2、Baichuan2、CodeLlama、Llma2、Llama、Qwen、Baichuan、ChatGLM2、InternLM、Ziya、Bloom等大模型。


项目简介

Firefly(流萤) 是一个开源的中文大语言模型项目,支持QLoRA和全量参数微调Baichuan2、CodeLLaMA、LLaMA2、LLaMA、Qwen、Baichuan、ChatGLM2、InternLM、Ziya、Bloom、XVERSE等开源模型。 正如我们的项目名称一样,希望本项目能够像流萤一般发出淡淡微光,为中文大语言模型社区尽绵薄之力,促进中文大语言模型社区的发展。

如果你的训练资源有限,我们极力推荐使用QLoRA的指令微调方式,因为我们在Open LLM Leaderboard上验证了该方法的有效性,详情见模型评测章节。

流萤(萤火虫的别称)是中华传统文化的一个符号,虽说腐草为萤,带有悲悯意味,但萤火虽小,也能凭借其淡淡荧光,照亮夜空。本项目的名称取自杜牧的《秋夕》:银烛秋光冷画屏,轻罗小扇扑流萤。


项目内容

项目主要内容如下:

支持全量参数指令微调、QLoRA低成本高效指令微调、其中QLoRA是我们主推的一种高效的训练方式。

支持绝大部分主流的开源大模型,如Baichuan2、CodeLLaMA、LLaMA2、LLaMA、Qwen、Baichuan、ChatGLM2、InternLM、Ziya、Bloom、XVERSE等。

支持lora与base model进行权重合并,推理更便捷。

模型裁剪:通过LLMPruner:大语言模型裁剪工具 ,开源裁剪后的Bloom模型权重 。在保留预训练中文知识的前提下,有效减少模型参数量,降低训练成本,提高训练效率。

整理并开源指令微调数据集:firefly-train-1.1M 、moss-003-sft-data、ultrachat、 WizardLM_evol_instruct_V2_143k、school_math_0.25M。

开源Firefly系列指令微调模型权重 。

在Open LLM Leaderboard上验证了QLoRA训练流程的有效性。


安装环境

在requirements.txt下固定了几个主要的python包的版本,执行如下脚本即可。

注意:Baichuan2需要安装pytorch 2.0。除Baichuan2以外,其他模型的训练,我们均在torch==1.13上进行训练。

pip install requirements.txt


仅供个人学习参考/导航指引使用,具体请以第三方网站说明为准,本站不提供任何专业建议。如果地址失效或描述有误,请联系站长反馈~感谢您的理解与支持!

链接: https://web.fly63.com/nav/4041

更多»
热门资源
豆包AI
字节跳动旗下 AI 智能助手
官网
方舟(Coding Plan)
火山引擎推出的大模型API聚合订阅服务
官网
Trae编程
字节跳动推出的 AI原生编程工具
官网
AI免费生成PPT
一句话,一分钟,一键生成PPT
官网
ArkClaw龙虾
能自己操控电脑、帮你干活的AI智能体
官网
码上飞(CodeFlying)
用一句话自动生成小程序、APP、H5网页应用
官网
Seedance 2.0
字节跳动新一代AI视频生成模型全面解析
链接直达
爱派AiPy
一款可本地部署的AI智能体,帮你操作电脑、手机、服务器设备
官网
AIGC检测(降AI率)
降ai神器,AI率降低至10%以下,一站式解决查重
官网
LibTV
LiblibAI 打造的一站式 AI 内容创作社区
官网
iSlide PPT
让PPT设计简单起来,PPT模板下载平台
官网
扣子Coze
职场AI,就用扣子,重塑生产力与工作效率
官网
类似于Firefly(流萤)的资源
AIMedia
全自动AI自媒体,热点抓取、AI创作与多平台发布
点击进入
GitHub
SiliconFlow
一个AI模型云服务平台
官网
Photiu.ai
AI一键去背景,专业产品摄影助手
官网
Dify
打造生产级 Agentic AI解决方案
官网
GitHub
商量智能助手
商汤科技AI对话产品
官网
Bloome
AI像真人一样在群里聊天,多智能体群聊做成现实
官网
Qwen-Image-Layered
阿里推出的AI图像编辑模型
点击进入
GitHub
FakeYou
一款功能强大的文本到语音工具
官网
目录

手机扫一扫预览

首页 技术导航 在线工具 技术文章 教程资源 前端标签 AI工具集 前端库/框架

Copyright © 2018 Web前端开发网 All Rights Reserved. 分享编程学习资源(教程/框架/库)、在线工具、技术教程、内容以学习参考为主,助您解决各类实际问题,快速提升专业能力。