LSIP

大规模集成网页,集成超过一千个链接的网页 
Large Scale Integrated web Page

View project on GitHub

链接计数(LC)

Link Count

  链接,全称‘超文本链接’,是万维网的本质特征。 集成网页专门收录单一主题的超链接,收录数量决定集成规模的大小。链接计数(LC)是指:页面单一主题链接的个数,本文解释统计方法。中英文术语简称如下:

	超文本链接	Hypertext Link
简称:	  超链接	Hyper-Link
 或:	   链接	Link

  典型的超链接在HTML源代码中写法如下:

	<a href="./" title="回到首页" target="_self">大规模集成网页</a>
	<a href="https://laosheng.top" title="老生常谈" target="_blank">大萌的网站</a>

  效果如下:

  这是两种链接,一个在原浏览器窗口,跳转到站内当前目录默认页‘./’;另一个打开新窗口,跳转到站外laosheng.top网站。集成网页收录的链接一般是站外链接(有‘http’前缀的网址),链接计数时需要排除前者。 以‘央企股’为例统计:

  从页面截图上可以看到页面分成几个部分,该页面主题是‘央企和央企发行的股票’,收录链接集中在上下两个部分,红色部分是央企相关链接,黄色部分是股票相关链接,上下部分通过三角形图标跳转,这些跳转链接需要排除在统计之外。

央企股的截图

源代码中的统计

未完待续……

设计LC

  在设计LSIP时可以预测链接数量,通过与实际收录链接数的比值,可以计算出收录工作的完成率。

仍以央企股页面为例,理论上链接总数可以计算:

	  98家央企 × 每家4个链接(官网、站群、微博、媒体)= 392个
+	 436支股票 × 每支2个链接(信息披露页、公司官网)=  872个
=	1264个

未完待续……

LSIP / 链接计数(LC)