实用哲学 · 认识、证据与判断
少比谁的观点多,多看证据够不够、判断稳不稳,以及话讲得顺怎么造出假确定。搞 AI 的,评测首先是认识论问题。
评测、证据、可信度、架构取舍、团队分歧——讨论很热闹却缺判断基础时,从这两篇读。
分数回答不了「我们凭什么相信变好」;没有证据结构,评测只是把直觉做成仪表盘。
知识表示是把世界结构译成机器可一致使用的形式:概念、关系、约束、推断与版本契约,缺一就semantic drift。