# 快速入门

# 📚简介

SmartJavaAI是专为JAVA 开发者打造的一个功能丰富、开箱即用的 JAVA AI算法工具包，致力于帮助JAVA开发者零门槛使用各种AI算法模型，开发者无需深入了解底层实现，即可轻松在 Java 代码中调用人脸识别、目标检测、OCR 等功能。底层实现涵盖了 C++、Python 等语言的深度学习模型。后续将持续扩展更多算法，目标是构建一个“像 Hutool 一样简单易用”的 JAVA AI 通用工具箱

# 📌 支持功能

人脸识别
- 人脸检测：人脸区域检测、5点人脸关键点定位
- 人脸识别：人脸512维特征提取、人脸对齐、1:1 人脸比对、1:N 人脸识别
- 人脸库：人脸注册、更新、查询、删除(支持向量数据库milvus/sqlite)
- 人脸属性检测：性别、年龄、口罩、眼睛状态、脸部姿态
- 静默活体检测：图片、视频活体检测
- 人脸表情识别：7种表情识别
- 人脸质量评估：亮度评估、清晰度评估、完整度评估、姿态评估、遮挡评估
目标检测
- 支持多种主流模型：集成 YOLOv5、YOLOv8、YOLOv11、YOLOv12、Tensorflow Object Detection 等目标检测算法
- 支持自定义模型加载：可无缝加载并部署用户自行训练的目标检测模型
- 集成行人检测模型
语义分割
- 集成DeepLabV3模型
实例分割
- 集成YOLOv8-seg、YOLOv11-seg、Mask R-CNN等模型
OBB旋转框目标检测
- 集成YOLOv11-obb模型
动作识别
- 支持KINETICS400数据集中400个人类动作识别
姿态估计
- 集成YOLOv8-pose、YOLOv11-pose等模型
OCR文字识别
- 支持PaddleOCR 3.0模型：集成最新PP-OCRv5、PP-OCRv4、表格结构识别模型(SLANet_plus)、文本行方向分类模型
- 支持任意角度识别，方向校准
- 支持通用文字识别，通用手写字识别
- 支持表格识别
- 支持中文车牌识别：单层/双层检测，颜色识别，支持12种中文车牌
机器翻译
- 集成NLLB-200模型：支持200+语言互相翻译
语音识别
- 集成openai的whisper模型：支持100种语言
- 集成vosk语音识别

# 🌟 AI集成方式对比

方案	技术特点	优点	缺点
OpenCV	传统图像处理方案	✅ 提供java接口 ✅ 轻量级部署 ✅ 社区资源丰富	❌ 基于传统算法精度低(60%-75%) ❌ 需本地安装环境
‌商业闭源SDK（如虹软等）‌	商业级闭源解决方案	✅ 开箱即用 ✅ 提供完整文档和SDK ✅ 支持离线活体检测	❌ 免费版需年度授权更新 ❌ 商业授权费用高 ❌ 代码不可控
‌云API(阿里云)‌	SaaS化云端服务	✅ 零部署成本 ✅ 支持高并发 ✅ 自带模型迭代	❌ 网络延迟风险(200-800ms) ❌ 按调用量计费 ❌ 有数据安全风险
‌Python混合调用‌	跨语言调用方案	✅ 可集成PyTorch/TF等框架 ✅ 支持自定义算法 ✅ 识别精度高	❌ 需维护双语言环境 ❌ 进程通信性能损耗(30%+) ❌ 异常处理复杂度翻倍
‌JNI/JNA‌	跨语言底层调用方案	✅ 直接调用 C/C++ 高性能算法库 ✅ 支持调用各种原生成熟库 ✅ 可封装成通用工具Jar	❌ 开发成本高，JNI更复杂 ❌ 跨平台兼容性差
‌DJL框架‌	深度学习框架	✅ 纯Java实现 ✅ 支持主流深度学习框架 ✅ 可加载预训练模型(99%+)	❌ 需掌握DL知识 ❌ 需处理模型加载、预处理、后处理等复杂技术细节
‌SmartJavaAI‌	java深度学习工具包	✅ 支持主流深度学习框架 ✅ 提供丰富、开箱即用API ✅ 上手简单，单一Jar包集成	无

# 🛠️包含组件

模块	介绍
common	基础通用模块，封装了公共功能，供各算法模块共享使用
bom	依赖管理模块
face	人脸功能模块
vision	通用视觉模块(目标检测等功能)
ocr	OCR文字识别模块
translate	机器翻译模块
speech	语音功能模块，包含 ASR 和 TTS

可以根据需求对每个模块单独引入，也可以通过引入all方式引入所有模块。

# SmartJavaAI 架构图

# 📦 安装

安装教程

# 完整示例代码

示例代码 (opens new window)

# 模型简介及下载

模型下载

# 联系方式

如您在使用过程中有任何问题或建议，欢迎添加微信，与我们交流并加入用户交流群

微信: deng775747758 （请备注：SmartJavaAI）
Email: 775747758@qq.com

🚀 如果这个项目对你有帮助，别忘了点个 Star ⭐！你的支持是我持续优化升级的动力！ ❤️

人脸识别 →