可以才能考以下链接:
[原版 HuggingFace] https://huggingface.co/fancyfeast/llama-joycaption-alpha-two-hf-llava [原版 Github] https://github.com/fpgaminer/joycaption [量化版 HuggingFace] https://huggingface.co/John6666/llama-joycaption-alpha-two-hf-llava-nf4 [国内 ModelScope 镜像] https://modelscope.cn/models/muse/fancyfeast-llama-joycaption-alpha-two-hf-llava
原版介绍:
中文翻译:
For Me:
Qwen2.5-VL 模型似乎也是不错的选择. 
正常情况下, 您不需要执行此命令. 因为模型已经通过 LFS 保存到了仓库中
huggingface-cli download --local-dir models/llama-joycaption-alpha-two-hf-llava-nf4 John6666/llama-joycaption-alpha-two-hf-llava-nf4
推荐使用 uv 作为包管理器
# 安装 UV curl -LsSf https://astral.sh/uv/install.sh | sh uv python install 3.12 # 安装虚拟环境 uv venv -p 3.12 source ./venv/bin/activate uv pip install -r requirements.txt -i https://mirrors.cloud.tencent.com/pypi/simple
也可以只使用 pip:
pip install -r requirements.txt -i https://mirrors.cloud.tencent.com/pypi/simple
运行:
python3 main.py example/*
在 CNB.cool 环境下, 大概每分钟十张图片.