完全免费、无 API key、不限速(合理使用)
对滥用 IP 会自动封锁(合理使用即可)
GET https://en.wikipedia.org/api/rest_v1/page/summary/Einstein 拿文章 summary。MediaWiki API 在 /w/api.php,支持更复杂 query。
可用率 · 30 天窗口
关于这个 API
Wikimedia 家族(Wikipedia、Wiktionary、Wikidata、Wikimedia Commons、Wikiquote 等)的 API 是开源知识库的基础设施。最常用的两个:(1) Wikipedia REST API——按标题拿文章 summary、完整正文、图片、参考链接、相关链接。LLM RAG 应用大量使用。(2) Wikidata SPARQL/REST——结构化数据(每个事实都是 entity + property + value 三元组),适合做知识图谱、跨语言对齐、和 AI 训练。Wikimedia Commons API 提供 8000 万+ 免费媒体文件(图片、视频、音频),所有都是 CC 协议可商用。完全免费用,合理使用即可(没有明确 rate limit 但被认为是 abusive 会被封 IP)。
你可以做什么
- 1AI 助手回答问题的 RAG 知识源
- 2维基百科镜像/搜索应用
- 3基于 Wikidata 做知识图谱
- 4Commons 媒体文件搜索
优劣对比
优点
- 完全免费、无 API key、不限速(合理使用)
- 300+ 种语言版本
- 内容版权 CC BY-SA 开放
注意事项
- 对滥用 IP 会自动封锁(合理使用即可)
- 某些争议性内容会被频繁编辑,数据 freshness 是双刃剑
示例请求
curl http://mediawiki.org/wiki/REST_API/<endpoint>快速开始
GET https://en.wikipedia.org/api/rest_v1/page/summary/Einstein 拿文章 summary。MediaWiki API 在 /w/api.php,支持更复杂 query。
常见问题
rate limit 是多少?+
没有官方明确数字。"reasonable use" 一般 200/秒 OK。大批量爬取要用 Wikipedia dumps(每月发布)。
中文 Wikipedia 用哪个 endpoint?+
换 host:https://zh.wikipedia.org/api/rest_v1/...
技术细节
- 认证方式
- unknown
- 计费
- unknown
- 协议
- REST
- SDK
- python, javascript, php, go
- 响应时间
- 853 ms
- 上次巡检
- 2026/5/12 07:38:39
