For ALL GB in 工*标*网 to Excel

For ALL GB in 工*标*网 to Excel

For ALL GB in 工*标*网 to Excel-寻找资源网
For ALL GB in 工*标*网 to Excel
此内容为付费资源,请付费后查看
10
立即购买
您当前未登录!建议登陆后购买,可保存购买订单
seekresource@163.com
1919588043
QQ1919588043
寻找资源网
微信小店:活生好美
付费资源
可能还有人在质疑AI的能力,可以明确的说,AI让我看到了一个路径,实现自己想法的捷径。今天我分享一下工具的成果:所有的、现行的GB 供大家下载,共计18465条。
很多人留言要软件工具、要源代码。换位思考一下,我不是在乎我的这点成果,而是在乎网站版权方……

通过网盘分享的文件:现行国家标准20250919.xlsx(点击购买获取网盘数据

再付一下上次的文章,这个是个大工程,业务时间在做这个事情……

图片[1]-For ALL GB in 工*标*网 to Excel-寻找资源网

代码是用PyCharm编的,软件是免费版的,时间是8小时以外的,大家有兴趣可以交流想法。分享一下代码,如有侵权,告知立即删除

1. 这是引用的库,反正都是AI做的,我就学了几个,也了解它是做什么的,这就够了。

import asyncio
import aiohttp
from lxml import etree
import pandas as pd
import random
import tkinter as tk
from tkinter import ttk, scrolledtext, messagebox, simpledialog
import threading 
from datetime import datetime
from aiohttp import ClientError, ClientResponseError
import os
import ctypes
import hashlib
from pathlib import Path

2.核心代码

以下是开发思路

  1. 获取报告中的所有引用依据
    • 内容包括法律、法规、部门规章、规范性文件和标准
    • 储存为便于操作的文件,比如xls或json
  2. 获取公开的信息
    • 国家法律法规数据库
    • https://flk.npc.gov.cn/index
    • 图片[2]-For ALL GB in 工*标*网 to Excel-寻找资源网

      国家规章库

    • https://www.gov.cn/zhengce/xxgk/gjgzk/index.htm
    • 图片[3]-For ALL GB in 工*标*网 to Excel-寻找资源网

    • 国家行政法规库
    • https://xzfg.moj.gov.cn/sear
    • 图片[4]-For ALL GB in 工*标*网 to Excel-寻找资源网

    • 全国标准信息公共服务平台
    • https://std.samr.gov.cn/
    • 图片[5]-For ALL GB in 工*标*网 to Excel-寻找资源网

    • 工标网
    • http://www.csres.com/
    • 图片[6]-For ALL GB in 工*标*网 to Excel-寻找资源网

  3. 数据定期获取并形成基准并保存
  4. 将报告中获取的引用依据在基准中进行查询,生成比对文件。
  5. 难点在哪里?
    • 报告中标准引用的写法多种多样,没有统一的格式,需要多种匹配方法,才能保证准确性。
    • 获取基准的网站架构不同,爬虫思路也不同,需要分别开发。
    • 爬取数据要遵守robots协议的,否则有法律风险,这也是为什么还没有给留言的人公开软件的原因,这个问题需要去了解相关的规定,避免违规。
© 版权声明
THE END
喜欢就支持一下吧
点赞7 分享
相关推荐
评论 抢沙发

请登录后发表评论

    暂无评论内容