⚖️ 【劳盾卫士】劳动法律咨询助手

⚖️ 【劳盾卫士】劳动法律咨询助手

前言

【劳盾卫士】劳动法律咨询助手，本项目所使用的大模型均通过 API 接口调用，未使用本地显卡运行大模型，同时提供本地模型封装类，后续提供请放心使用～

本文主要介绍了基于RAG（检索增强生成）技术的智能法律咨询系统，专门针对中国劳动法领域问题提供专业解答，并附带法律条文依据。法律相关文件可参考：https://flk.npc.gov.cn/

📌 核心功能

精准法律问答：基于最新劳动法律法规数据库，提供权威解答
条文溯源：每个回答自动关联相关法律条款，支持查看原文
多模型集成：
- 百度文心/阿里百炼：文本嵌入(Embedding)与重排序(Rerank)
- 智谱AI/阿里千问AI：大语言模型生成回答
知识库管理：支持JSON数据自动解析与向量存储更新

🛠️ 技术架构

graph TD
    数据向量化并存入Chroma数据库 --> A
    A[用户提问] --> B(Embedding向量化)
    B --> C[Chroma向量库检索]
    C --> D[Rerank重排序]
    D --> E[大模型AI生成回答]
    E --> F[返回答案+法律依据]

📂 项目结构

LaborGuard
├──data/                                          # 数据存储目录（包含原始法律条文和向量数据库）
│   ├──storage/                                   # 向量数据库持久化存储
│   │   ├──9cab749f-5c2d-49f3-be72-f6236314e806/  # ChromaDB的HNSW索引二进制文件（近似最近邻搜索用）
│   │   │   ├──data_level0.bin                    # 层级0的向量数据
│   │   │   ├──header.bin                         # 索引头信息
│   │   │   ├──length.bin                         # 向量长度信息
│   │   │   └──link_lists.bin                     # 图结构的连接关系
│   │   ├──chroma.sqlite3                         # ChromaDB的主数据库文件（SQLite3格式）
│   │   ├──docstore.json                          # 文档存储元数据
│   │   ├──graph_store.json                       # 知识图谱关系存储
│   │   ├──image__vector_store.json               # 图片特征的向量数据
│   │   └──index_store.json                       # 索引元数据
│   └──上海市劳动合同条例.json                      # 原始法律条文数据（JSON格式）
│   └──中华人民共和国劳动争议调解仲裁法.json         # 原始法律条文数据（JSON格式）
│   └──中华人民共和国劳动合同法.json                # 原始法律条文数据（JSON格式）
│   └──中华人民共和国劳动合同法实施条例.json         # 原始法律条文数据（JSON格式）
│   └──中华人民共和国劳动法.json                    # 原始法律条文数据（JSON格式）
│   └──中华人民共和国社会保险法.json                # 原始法律条文数据（JSON格式）
│   └──工伤保险条例.json                            # 原始法律条文数据（JSON格式）
├──logs/                                          # 自动生成的日志文件目录
│   └──law_assistant_20250524.log                 # 按日期分割的日志文件（格式：YYYYMMDD）
│   └──system_20250611.log                        # 按日期分割的日志文件（格式：YYYYMMDD）
├──old/                                           # 原始法律文件，PDF,DOCX
│   └──上海市劳动合同条例.pdf
│   └──中华人民共和国劳动争议调解仲裁法.docx
│   └──中华人民共和国劳动合同法.docx
│   └──中华人民共和国劳动合同法实施条例.docx
│   └──中华人民共和国劳动法.docx
│   └──中华人民共和国社会保险法.docx
│   └──工伤保险条例.docx
├──src/                                           # 核心源代码目录
│   ├──api/                                       # 接口访问
│   │   ├──__init__.py                            # 默认
│   │   ├──api.py                                 # API接口访问
│   ├──apitest/                                   # 接口访问
│   │   ├──__init__.py                            # 默认
│   │   ├──apiTest.py                             # API接口测试访问
│   ├──common/                                    # 公共模块
│   │   ├──constants.py                           # 全局常量（日志级别、路径配置等）
│   │   ├──decorator.py                           # 装饰器工具（如 @timer 计时器）
│   │   ├──log.py                                 # 日志系统核心（多线程安全、颜色输出）
│   │   └──utils.py                               # 通用工具函数（如YAML文件读取）
│   ├──config/                                    # 接口访问
│   │   ├──__init__.py                            # 默认
│   │   ├──config.py                              # 配置类
│   ├──conversion/                                # 脚本转换
│   │   ├──__init__.py                            # 默认
│   │   ├──上海市劳动合同条例.py                    # 转换脚本
│   ├──handler/                                   # 数据处理管道（JSON解析、向量库初始化）
│   │   ├──__init__.py                            # 默认
│   │   ├──data_handler.py                        # 数据处理管道（JSON解析、向量库初始化）脚本
│   ├──models/                                    # 模型实现
│   │   ├──embedding/                             # 文本嵌入模型
│   │   │   └──baidu.py                           # 百度文心Embedding模型封装
│   │   │   └──dashscope.py                       # 阿里百炼Embedding模型封装
│   │   ├──llm/                                   # 大语言模型
│   │   │   └──zhipu.py                           # 智谱AILLM接口封装
│   │   │   └──qwen.py                            # 通义千问AILLM模型封装
│   │   └──rerank/                                # 检索结果重排序
│   │   │   └──baidu.py                           # 百度文心Rerank模型封装
│   │   │   └──baidu.py                           # 阿里百炼Embedding模型封装
│   ├──msg/
│   │   ├──msg.py                                 # 消息处理
│   ├──ragflow/
│   │   ├──ragflow.py                             # RAG流程核心（检索-重排序-生成）
│   ├──main.py                                    # Streamlit交互界面入口
├──.env                                           # 配置文件（API密钥等敏感信息）
├──README.md                                      # 项目说明文档
└──requirements.txt                               # Python依赖库列表

🚀 快速开始

前置要求

Python 3.12
百度/智谱API密钥（配置于.env）
安装依赖：pip install -r requirements.txt

配置说明

配置文件.env中可以进行个性化修改：

# API Keys
BAIDU_API_KEY=""
ZHIPU_API_KEY=""
DASHSCOPE_API_KEY=""
DEEPSEEK_API_KEY=""

# 模型配置
BAIDU_EMBEDDING_MODEL="bge-large-zh"
BAIDU_RERANK_MODEL="bce_reranker_base"
ZHIPU_LLM_MODEL="glm-z1-airx"
DASHSCOPE_EMBEDDING_MODEL="text-embedding-v1"
DASHSCOPE_RERANK_MODEL="gte-rerank"
DASHSCOPE_LLM_MODEL="qwen-plus"
DEEPSEEK_LLM_MODEL="deepseek-chat"

# RAG 参数
RAG_TOP_K=20
RAG_RERANK_TOP_N=20
RAG_RERANK_MIN_SCORE=0.5
LLM_TEMPERATURE=0.7
LLM_TOP_P=0.9

API_KEY 申请链接：

启动系统

在项目根目录下执行

streamlit run src/main.py

首次启动项目时，可能会比较慢。这是因为项目初始化的时候，data 目录下只有 *.json 数据，首次执行会对数据进行向量化处理，并创建索引以及将数据存入 Chroma 数据库等操作。注意事项：阿里百炼和百度云的EMBEDDING模型加载的维度不一致，所以要区分使用。

🔧 核心模块说明

日志系统

多线程安全日志器
自动按日期分割日志文件
支持动态配置日志级别/输出目标

数据处理

自动验证JSON法律文件结构
稳定ID生成策略
向量存储自动更新机制

RAG流程

混合检索（密集+稀疏）
基于相关度重排序
带法律约束的答案生成

🌟 特色功能

智能过滤：自动识别非法律问题
思考可视化：展示模型推理过程
参考条文展开：直接查看法律原文
切换模型：可通过 .env 文件选择模型，特别是有无带有思维链的LLM大模型

📜 许可证

MIT License

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

⚖️ 【劳盾卫士】劳动法律咨询助手

前言

📌 核心功能

🛠️ 技术架构

📂 项目结构

🚀 快速开始

前置要求

配置说明

启动系统

🔧 核心模块说明

日志系统

数据处理

RAG流程

🌟 特色功能

📜 许可证

About

Uh oh!

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
data		data
old		old
src		src
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
requirements.txt		requirements.txt

License

joecheng521/LaborGuard

Folders and files

Latest commit

History

Repository files navigation

⚖️ 【劳盾卫士】劳动法律咨询助手

前言

📌 核心功能

🛠️ 技术架构

📂 项目结构

🚀 快速开始

前置要求

配置说明

启动系统

🔧 核心模块说明

日志系统

数据处理

RAG流程

🌟 特色功能

📜 许可证

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages