tw-opendata-taipei-city — 臺北市資料大平臺鏡像 (Extension)
屬性:OpenData Extension 系列
本 corpus 屬 OpenData Extension — 來源 data.taipei(臺北市政府開放 資料平臺),由 Twinkle AI 自行鏡像。 v1.35 ship 165 個 dataset:
- 89 個 unique to data.taipei(不在中央 data.gov.tw 主目錄,純臺北市獨家)
- 89 個淹水/水利/災防(含 13 個重疊),即使 data.gov.tw 也有,但 data.taipei 是 fresher upstream
跟其他 extension 並列:tad-* (觀光統計) / dronegis-* (無人機禁航) / ly-* (立法院) / pcc-tender (政府採購) / lvr-* (實價登錄) / jud-* (司法判決) / kh-* (高雄社群)。
Corpus 概況
| 主題 | 範例 dataset_id | 內容 |
|---|---|---|
| 🚨 淹水/災防 | tp-00003975 易積水地區 (9 區塊 KML) | 紅黃藍區、易發生淹水的點/區範圍 |
| 🚨 | tp-00000862 降雨積水模擬圖 (78.8/100/130 mm 三種雨量情境 KML) | 雨量強度下可能淹水範圍 |
| 🚨 | tp-00000422 翡翠水庫即時水情 (每 1 時 JSON) | 即時水位 + 蓄水量 + 雨量站 |
| 🚨 | 災時供水/學校/旱災/緊急/臨時/防災地下水井 (6 KML) | 災後可取水點清冊 |
| 🚨 | 各區里疏散避難地圖 (12 區 CSV) | 12 區 × 各里疏散場所 |
| 💧 水利 | 抽水站 / 臨時抽水井 / 雨量站 / 水位計 / 雨水下水道水位監測站 / 防洪陸閘 | 全市水利設施座標 |
| 💧 | 雨水下水道管線 (17408 segments) / 污水下水道 / 公共管線 | 全市管線 GIS |
| 💧 | 河川水位站 / 河流 / 河川區域線 / 主要橋樑計畫洪水位 | 河川 GIS |
| 🔥 消防 | 大臺北地區消防栓分布 | 消防栓位置 |
| 🏟️ 公共設施 | 小巨蛋場地 / 廣告 / 廣場 / 冰上樂園 / 兒童新樂園 / 直飲臺 / 指定吸菸區 | 場地租用 + 公共空間 |
| 💰 稅務財政 | 牌照稅按性別 / 徵績 / 公債本息撥付 / 歲入歲出預決算比較 | 稅務財政統計 |
| 🚗 交通 | 臺北市死傷交通事故資料 | 事故資料 |
| 🏥 醫療 | 旅遊醫學門診醫院名冊 / 衛生優良場所 (浴室業) | 醫療場所 |
| 🎓 教育 | 國中小進修部概況 / 學校相關 | 教育統計 |
實際 165 個 dataset 完整清單可 query catalog:
search_datasets(query="", limit=200) where dataset_id LIKE 'tp-%'
每月 cron sync
每月 1 號 04:45 從 data.taipei catalog endpoint
(/api/frontstage/tpeod/dataset.download?format=json) diff 上游 資料最後更新時間,
有變動才 re-fetch。 idempotent。
MCP Tools
query_rows(dataset_id, where?, columns?, limit?)— 主用法get_dataset(dataset_id, sample_rows)— 看 schema + sample
範例 query
A) 淹水查詢
# 1. 易積水地區清單
query_rows("tp-00003975", limit=20)
# 2. 降雨積水模擬 (78.8/100/130 mm 三種情境)
query_rows("tp-00000862",
columns=["name","description","geometry_centroid"])
# 3. 翡翠水庫即時 (水位 / 蓄水量 / 集水區雨量)
query_rows("tp-00000422")
# 4. 抽水站位置 (查附近)
query_rows("tp-XXXXX", # 用 search_datasets 找抽水站 ID
where="geometry_centroid LIKE '121.5%,25.0%'", # 雙北附近
limit=20)
B) 災時取水 / 疏散避難
# 災時緊急供水站清單
query_rows("tp-YYYYY", # 對應災時緊急供水站
columns=["name","description","geometry_wkt"])
# 內湖區疏散避難地圖
query_rows("tp-ZZZZZ", # 對應內湖區里疏散
where="里 ILIKE '%內湖%'")
C) 交通事故 / 牌照稅 (臺北市獨家)
# 死傷交通事故
query_rows("tp-WWWWW", limit=20)
# 按性別牌照稅
query_rows("tp-VVVVV",
columns=["年度","性別","金額"],
group_by=["性別","年度"])
Schema 注意事項
- 中文欄位多: 多用
"中文欄位"雙引號 - 格式多元:
- CSV native (大多): 直接 query_rows
- KML (12 個圖資): 自動轉成 CSV +
geometry_wkt(POLYGON/LINESTRING/POINT WKT) +geometry_centroid("lon,lat") - JSON (3 個 — 翡翠水庫, etc.): 自動 flatten
- XML/SHP/XLS (5 個): 只有 raw,無 query_rows 可查,raw 檔在 GCS
gs://twinkle-opendata-corpus/raw/data_taipei/
- 編碼: 部分 dataset 來源 Big5,fetcher 自動 detect + 轉 UTF-8 normalise
- 更新頻率: 從每 1 時 (即時水庫) 到每 1 年 不等。 cron 每月一次,有變動才 re-fetch
- 每個 dataset metadata.json 有
is_unique_to_data_taipei+is_flood_relevantflag, 可用來篩
跟 data.gov.tw 既有的分工
| 資料 | 來源 |
|---|---|
| 臺北市政府所屬 dataset (2755 筆) 大部分 | data.gov.tw (中央彙整),numeric ID like 145813 |
| 89 個 unique to data.taipei | 本 extension tp-* |
| 89 個淹水/水利/災防 (含 13 重疊) | 本 extension tp-* (fresher),也可走 data.gov.tw 對應 ID 但可能過時 |
→ 「臺北市附近禁飛區」 / 「臺北機場禁區」 走 dronegis-*(全國民航)。
→ 「臺北市淹水/災防/水利」 走本 extension tp-*。
→ 「全國觀光統計」 走 tad-*。
→ 一般「臺北市開放資料 (景點 / 旅館 / 補助)」走中央 data.gov.tw numeric ID。
來源 / License
原始 catalog: https://data.taipei/api/frontstage/tpeod/dataset.download?format=json
個別 dataset: https://data.taipei/api/dataset/{uuid}/resource/{uuid}/download
License: 政府資料開放授權條款-第 1 版 (OGDL v1) — 嚴格列名,最乾淨的 license in extension series。 (相比 ly/pcc/jud/tad/dronegis 都是 OGDL-style 自家宣告,本 extension 是真正的 OGDL ✓。)