总览

本库不接入企查查/天眼查/爱企查的付费 API,采用「公开检索 + 人工核验 + 结构化入库」;v0.2 起将工商「经营范围」关键词纳入发现层,用于补全长尾北京主体。

数据来源与用途

爱企查

工商主核验:法人、注册资本、成立日期、注册地址、经营范围、参保人数(年报)

访问方式:网页检索 / 企业详情页;无官方开放 API 接入本库

主要字段: legalRep、registeredCapital、founded、address、businessScope、staffSize

企查查

交叉核验:法人变更、融资/股东、司法与经营异常

访问方式:网页检索;无 API 接入

主要字段: legalRep、investors、funding、riskFlags

天眼查

交叉核验:与企查查类似,用于报道中的工商变更二次确认

访问方式:网页检索;无 API 接入

主要字段: legalRep、registeredCapital、investors

政府/园区/媒体

产业节点与融资/产品证据:投促中心、亦庄报道、36氪/新浪/新京报等

访问方式:公开网页与 research/search-*.json 检索快照

主要字段: products、scenes、funding、teamBackground

API 现状

当前未接入爱企查 / 企查查 / 天眼查付费或开放 API。 meta.json 中「对接企查查/爱企查 API」为规划项。当前入库脚本(research/enrich_companies.py、aiqicha_urls.py)通过人工复制链接与字段,不调用商业接口。

规划

发现层次

  1. 1 种子与图谱

    从世界机器人大会、亦庄/海淀园区报道、政策清单、已知龙头与 public-goods 节点(创新中心、智源、通研院)建立首批名单。

  2. 2 品牌/报道检索

    parallel-cli / 媒体检索公司名、产品名、融资新闻;适合已曝光创业公司,易漏掉仅有工商条目、尚无报道的长尾主体。

  3. 3 工商「经营范围」关键词(v0.2 新增)

    在爱企查/企查查/天眼查以注册地为北京市 + 下列关键词检索,读取「经营范围」字段;命中且与机器人/具身相关的,进入 W(观察)候选,再人工核对是否真为产业主体。

    经营范围 / 梳理关键词(北京市主体)

    • 智能机器人
    • 工业机器人
    • 智能机器人研发
    • 服务消费机器人
    • 人形机器人
    • 具身智能
    • 机器人技术开发
    • 协作机器人
    • 机器人系统集成
  4. 4 用户反馈与 diff

    缺口企业(如迪卡尔系)直接补录为 W(观察),并在本页记录命中路径,驱动下一版关键词或脚本调整。

收纳与归理

分级 rubric(摘录)

原始检索产物

批量网页检索结果保存在仓库 research/,例如:

与网站同步:复制 research/companies.jsonwebsite/src/data/companies.json 后构建部署。