重庆企业网站设计网页去噪流程
网页去噪流程:
1) 节点分割。将网页映射为DOM树, 根据当前DOM节点的信息以及子节点信息进行节点分割, 完成信息块提取。
2) 检测分割条。首先利用网页的初始坐标和终止坐标作为初始化分隔条, 然后利用页面块与分割条之间的位置关系生成新的检测条。
3) 利用分隔条的权值重构语义块, 沿着分隔条从低到高的方向进行迭代合并, 这样最终将网页分割成主题相关性很高的块的集合。
1) 节点分割。将网页映射为DOM树, 根据当前DOM节点的信息以及子节点信息进行节点分割, 完成信息块提取。
2) 检测分割条。首先利用网页的初始坐标和终止坐标作为初始化分隔条, 然后利用页面块与分割条之间的位置关系生成新的检测条。
3) 利用分隔条的权值重构语义块, 沿着分隔条从低到高的方向进行迭代合并, 这样最终将网页分割成主题相关性很高的块的集合。
微信号:Njkj-6688
添加微信好友, 获取相关信息
复制微信号
添加微信好友, 获取相关信息
复制微信号
评论