README_zh.md · master · alihub/WeClone

download

🚀 One-stop solution for creating your digital avatar from chat history 💡

🚀从聊天记录创造数字分身的一站式解决方案💡

✨核心功能

💫 涵盖打造数字分身的全链路方案，包括聊天数据导出、预处理、模型训练、部署
💬 使用聊天记录微调LLM，支持图片模态数据，让大模型有"那味儿"
🔗 绑定到Discord, Telegram, Slack, Feishu等，实现自己的数字分身
🛡️ 隐私信息过滤，本地化微调部署，数据安全可控

📋特性与说明

数据源平台适配

平台	文字	图片	语音	视频	动画表情	链接(分享)	引用	转发	位置	文件
Telegram	✅	✅	❌	❌	⚠️转为Emjoy	❌	❌	✅	✅	❌
WhatsApp	🚧	🚧	🚧	🚧	🚧	🚧	🚧	🚧	🚧	🚧
Discord	🚧	🚧	🚧	🚧	🚧	🚧	🚧	🚧	🚧	🚧
Slack	🚧	🚧	🚧	🚧	🚧	🚧	🚧	🚧	🚧	🚧

部署平台支持

平台	部署支持
Telegram	✅
WhatsApp	🚧
Discord	✅
Slack	✅

[!IMPORTANT]

WeClone仍在快速迭代期，当前效果不代表最终效果。

微调LLM效果很大程度取决于模型大小、聊天数据的数量和质量，理论上模型越大，数据越多，效果越好。

7B模型效果一般，14B及以上的模型效果会更好。

Windows环境未进行严格测试，可以使用WSL作为运行环境。

近期更新

[25/06/05]支持图片模态数据微调
[25/07/10]数据源增加Telegram

在线微调

大模型实验室 (Lab4AI) (送50元代金券): https://www.lab4ai.cn/project/detail?utm_source=weclone1&id=ab83d14684fa45d197f67eddb3d8316c&type=project

硬件要求

项目默认使用Qwen2.5-7B-Instruct模型，LoRA方法对sft阶段微调，大约需要16GB显存。也可以使用LLaMA Factory支持的其他模型和方法。

需要显存的估算值：

方法	精度	7B	14B	30B	70B	`x`B
Full (`bf16` or `fp16`)	32	120GB	240GB	600GB	1200GB	`18x`GB
Full (`pure_bf16`)	16	60GB	120GB	300GB	600GB	`8x`GB
Freeze/LoRA/GaLore/APOLLO/BAdam	16	16GB	32GB	64GB	160GB	`2x`GB
QLoRA	8	10GB	20GB	40GB	80GB	`x`GB
QLoRA	4	6GB	12GB	24GB	48GB	`x/2`GB
QLoRA	2	4GB	8GB	16GB	24GB	`x/4`GB

环境搭建

1.cuda安装(已安装可跳过，要求版本12.6及以上)：LLaMA Factory

2.建议使用 uv安装依赖，这是一个非常快速的 Python 环境管理器。安装uv后，您可以使用以下命令创建一个新的Python环境并安装依赖项，速度较慢可以开启代理：


git clone https://github.com/xming521/WeClone.git && cd WeClone
uv venv .venv --python=3.10
source .venv/bin/activate # windows下执行 .venv\Scripts\activate
uv pip install --group main -e . # 国内用户使用镜像：-i https://pypi.tuna.tsinghua.edu.cn/simple/ 
uv pip install https://github.com/explosion/spacy-models/releases/download/zh_core_web_sm-3.8.0/zh_core_web_sm-3.8.0-py3-none-any.whl

3.将配置文件模板复制一份并重命名为settings.jsonc，后续配置修改在此文件进行：


cp settings.template.jsonc settings.jsonc

微调多模态模型时，请使用examples/mllm.template.jsonc作为配置文件。

[!NOTE] 训练以及推理相关配置统一在文件settings.jsonc

4.使用以下命令测试CUDA环境是否正确配置并可被PyTorch识别，Mac不需要：


python -c "import torch; print('CUDA是否可用:', torch.cuda.is_available());"

5.（可选）安装FlashAttention，加速训练和推理：uv pip install flash-attn --no-build-isolation 版本问题可以使用prebuild-wheels的预编译包安装。

模型下载

中国境内推荐使用ModelScope下载模型。例如下载WeClone默认模型：


modelscope download --model Qwen/Qwen2.5-7B-Instruct --local_dir ./models/Qwen2.5-7B-Instruct

数据准备

请使用Telegram Desktop导出聊天记录，点击右上角点击导出聊天记录，选择照片类型，格式选择JSON。可以导出多个联系人（不建议使用群聊记录），然后将导出的ChatExport_*文件夹放在./dataset/telegram目录即可，也就是不同人聊天记录的文件夹一起放在 ./dataset/telegram。

数据预处理

首先根据需要修改配置文件中的language、platform、include_type。
项目默认通过Microsoft Presidio去除了数据中的电话号码、电子邮件地址、信用卡号码（12-19位数字）、IP地址、地理位置名称、国际银行账户号码、加密货币钱包地址、年龄信息、通用身份证号码,但是不能保证100%过滤识别。
所以在settings.jsonc中提供了一个禁用词词库blocked_words，可以自行添加需要过滤的词句（会默认去掉包括禁用词的整句）。

[!IMPORTANT] 🚨 请一定注意保护个人隐私，不要泄露个人信息！

执行以下命令对数据进行处理，可以先根据自己的聊天风格修改settings.jsonc的make_dataset_args。


weclone-cli make-dataset

数据处理更多参数说明：数据预处理

配置参数并微调模型

(可选)修改 settings.jsonc 的 model_name_or_path 、template、 lora_target选择本地下载好的其他模型。
修改per_device_train_batch_size以及gradient_accumulation_steps来调整显存占用。
可以根据自己数据集的数量和质量修改train_sft_args的num_train_epochs、lora_rank、lora_dropout等参数。

单卡训练


weclone-cli train-sft

多卡训练

取消settings.jsonc中deepspeed行代码注释，使用以下命令多卡训练：


uv pip install "deepspeed<=0.16.9"
deepspeed --num_gpus=使用显卡数量 weclone/train/train_sft.py

使用浏览器demo简单推理

测试出合适的temperature、top_p值，修改settings.jsonc的infer_args后，供后续推理时使用。


weclone-cli webchat-demo

使用接口进行推理


weclone-cli server

使用常见聊天问题测试

不包含询问个人信息的问题，仅有日常聊天。测试结果在test_result-my.txt。


weclone-cli server
weclone-cli test-model

🖼️ 微调效果

[!TIP] 社群内有部署好的Qwen2.5VL 32B Bot，可以体验效果。

🤖 部署到聊天机器人

AstrBot

AstrBot 是易上手的多平台 LLM 聊天机器人及开发框架 ✨ 平台支持Telegram、飞书等。

使用步骤：

部署 AstrBot
在 AstrBot 中部署消息平台
执行 weclone-cli server 启动api服务
在 AstrBot 中新增服务提供商，类型选择OpenAI，API Base URL 根据AstrBot部署方式填写（例如docker部署可能为 http://172.17.0.1:8005/v1），模型填写gpt-3.5-turbo,API Key随意填写一个
微调后不支持工具调用，请先关掉默认的工具，消息平台发送指令： /tool off_all，否则会没有微调后的效果。
根据微调时使用的default_system，在 AstrBot 中设置系统提示词。

[!IMPORTANT] 检查api_service的日志，尽量保证大模型服务请求的参数和微调时一致，tool插件能力都关掉。

LangBot

LangBot 是一个开源的接入全球多种即时通信平台的 LLM 机器人平台，适合各种场景使用。

部署 LangBot
执行 weclone-cli server 启动 WeClone API 服务
在 LangBot 中添加一个机器人
在模型页添加新模型，名称gpt-3.5-turbo，供应商选择 OpenAI，填写请求 URL 为 WeClone 的地址，详细连接方式可以参考文档，API Key 任意填写。

在流水线配置中选择刚才添加的模型，或修改提示词配置

📌 路线图

支持更多数据源
更丰富的上下文：包括上下文对话、聊天对象信息、时间等
Memory 支持
支持多模态:已支持图片
数据增强
支持GUI
支持COT思考

问题解决

官方文档FAQ

同时建议使用DeepWiki解决问题。

❤️ 贡献代码

欢迎任何 Issues/Pull Requests！

你可以通过查看Issues或帮助审核 PR（拉取请求）来贡献。对于新功能的添加，请先通过 Issue 讨论。
开发环境：


uv pip install --group dev -e .
pre-commit install

项目使用pytest测试，pyright检查类型，ruff检查代码格式。
提交代码前你应该先运行pytest tests确保所有测试通过。

🙏 致谢

感谢以下代码贡献者和社区里其他成员的贡献

同时本项目受益于LLaMA-Factory、AstrBot、LangBot等优秀开源项目。

⚠️ 免责声明

[!CAUTION] 本项目仅供学习、研究和实验用途，用于生产环境存在较大风险，请谨慎评估。请勿用于非法用途，后果自负。
针对违规获取及利用微信终端用户数据行为的打击公告

[!IMPORTANT]

WeClone 目前未与任何平台合作，未发行任何数字货币。唯一官方网站：weclone.love，谨防仿冒。

点击查看免责条款

1. 使用风险自担

用户在使用本项目时，应充分理解并承担所有相关风险
本项目作者不对因使用本项目而产生的任何直接或间接损失承担责任
包括但不限于：数据丢失、经济损失、法律纠纷、个人名誉损害、社会关系影响、心理创伤、职业发展受阻、商业信誉受损等

2. 生产环境风险警告

用于商业用途或对外提供服务需自行承担全部风险
生产环境使用可能导致的所有后果（包括但不限于服务中断、数据安全问题、用户投诉、法律责任等）完全由用户承担
建议在生产环境使用前进行充分的测试、验证和风险评估

3. 模型输出不可靠性

微调后的模型可能产生不准确、有害或误导性的内容
模型输出不代表真实人物的观点或意图
用户应对模型输出进行人工审核和验证

4. 数据安全与隐私

用户应确保上传的聊天记录等数据符合相关法律法规
用户应获得数据相关人员的适当授权
本项目不对数据泄露或隐私侵犯承担责任

5. 法律合规

用户应确保使用本项目符合当地法律法规
涉及人工智能、数据保护、知识产权等相关法律
违法使用造成的后果由用户承担

6. 技术支持限制

本项目按"现状"提供，不提供任何明示或暗示的保证
作者不承诺提供持续的技术支持或维护
不保证项目的稳定性、可靠性或适用性

使用建议

强制性Bot身份标识

使用本项目生成的数字分身时，强烈建议：

在每次对话开始时明确标识为"AI Bot"或"数字分身"
在用户界面显著位置标注"此为AI生成内容"
避免让用户误认为是真实人类在对话，从而造成风险

风险评估建议

如确需在生产环境使用，建议：

进行全面的安全性测试
建立完善的内容审核机制
制定应急响应预案
购买相应的保险保障
咨询法律专业人士意见

本免责声明可能随项目更新而修订，用户应定期查看最新版本。继续使用本项目即表示同意最新的免责声明条款。

一旦您下载、克隆、修改、分发或以任何方式使用本项目的代码或模型，即表示您已完整阅读、理解并同意无条件接受本免责声明的全部条款。

请用户慎重阅读并理解本免责声明的所有内容，确保在使用本项目时严格遵守相关规定。

⭐ Star History

[!TIP] 如果本项目对您有帮助，或者您关注本项目的未来发展，请给项目 Star，谢谢

克隆我们，保留灵魂的芬芳