logo
0
0
Login
Initial commit

中文手写识别(基于 ResNet-50 + BiLSTM + CTC)

项目包含:

  • src/model.py:基于 ResNet-50 的特征提取器 + BiLSTM + 线性头,使用 CTC 解码
  • src/dataset.py:CSV 格式数据加载器(image_path,label),图像预处理与 collate
  • src/train.py:训练命令行脚本(argparse)
  • src/infer_gradio.py:Gradio 推理界面
  • requirements.txt:依赖

快速开始:

  1. 安装依赖:
pip install -r requirements.txt
  1. 训练示例命令:
python src/train.py --train_csv /path/to/train.csv --val_csv /path/to/val.csv --epochs 30 --batch_size 16 --save_dir checkpoints

CSV 格式:每行 image_path,label,例如:

/data/imgs/0001.png,你好 /data/imgs/0002.png,世界
  1. 启动 Gradio 推理:
python src/infer_gradio.py --checkpoint checkpoints/best.pt --vocab vocab.txt

说明:模型使用 CTC 损失,词表(vocab.txt)会在首次训练时从训练集自动构建并保存。