favoritecountry.xyz:把 2,274 則 Threads 旅行留言變成可追溯的城市偏好地圖
Travel Data / AI Workflow / Visualization
favoritecountry.xyz:把 2,274 則 Threads 旅行留言變成可追溯的城市偏好地圖
Threads 作者先問:「到目前為止,你旅遊體驗感排在第 1 名的城市是哪裡?」後續把 2,274 則有效留言、42,763 個讚、80 國旅人回覆整理成 favoritecountry.xyz。網站用 Three.js 地球、國家排行、城市統計與原始評論溯源,把社群討論變成可探索資料產品。
這個案例的價值:它不是單純「AI 幫忙排行程」,而是把社群留言先資料化,再用規則、LLM、語義核查與加權公式做成可追溯的旅行偏好地圖。真正可學的是資料產品流程。
資料來源
網站標示來源為 Threads 原帖 @jawinwangjawin/post/DZVCZeiFLt8,題目是「到目前為止,你旅遊體驗感排在第 1 名的城市是哪裡?」時間範圍 2026-06-08 至 2026-06-12。
處理流程
2,274 條評論經過三層處理:關鍵詞規則匹配命中 1,024 條;Qwen-plus 批量補充未命中評論 76 條;語義核查清空 62、收窄 56、新增 16。
可追溯設計
每個國家可追溯到原始評論,並標示 rules、llm、llm_verify。這讓讀者能檢查排行不是黑箱,而是能回到留言脈絡。
加權排行怎麼算
| 維度 | 權重 | 意義 |
|---|---|---|
| 頻次 | 0.50 | 推薦廣度:多少頂層留言真的把某國/城市列為第一名。 |
| 點讚總和 | 0.35 | 大眾認同:某些低頻但高共鳴評論會被拉高。 |
| L2-L4 討論 | 0.10 | 討論熱度:熱門評論帶出的互動,但避免它完全主宰排行。 |
| 認證用戶數 | 0.05 | 專業或公開身份背書,但只佔小權重。 |
Top 5 快照
網站無障礙區塊顯示加權前五名:日本、丹麥、義大利、挪威、西班牙。日本熱門城市包括京都、東京、北海道;義大利熱門城市包括羅馬、佛羅倫斯、威尼斯。
為什麼 L1 分開
網站說明:熱門評論會帶出大量回覆,若全部計入排行會讓單一爆款評論虛高。因此 L1 頂層評論代表真實推薦,L2-L4 只當討論度分項。
技術形態
網站 footer 標示 Built with Three.js、純前端、無後端、無登入、無追蹤。對小型資料產品來說,這是很輕量的發布方式。
可複製到其他題目的流程
- 用社群問題收集大量真實偏好,而不是先設計問卷。
- 保留原始留言 ID、作者、讚數、層級與時間。
- 先用規則抓高確定度結果,再用 LLM 補別名、縮寫與語義。
- 把「推薦」和「只是提到」分開,避免假陽性。
- 用加權公式公開排名邏輯,並讓每項結果可回查原文。
- 最後做成可分享的前端網站,而不是只丟 CSV。