跳到主要内容

CanonicalURL

CanonicalURL 用于代表一个页面 URL 的特征。该信息被广泛使用于 Benjamin 中用于去重。

备注

有计划开放自定义 CanonicalURL 的计算方式,但是目前还没有实现。以下叙述为 Benjamin 的默认行为。

尽管 CanonicalURL 的后缀是 URL,但其只是一个特征值(事实上,目前 Benjamin 的实现中有意使其不是一个真正的 URL 以避免误用)。

CanonicalURL 会忽略协议(http / https)、规范化 PATH、重排序 Query 等。

TargetResult 的 CanonicalURL 计算方式并不同,主要差异在于 Result 在计算 CanonicalURL 时会忽略 Segment,而 Target 则会保留。因此,比较 Target 和 Result 的 CanonicalURL 是无意义的。