易源数据-智能识别网页正文

互联网上几十万个站点,每个站点还有N个不同的文章页面模版 如何能只编写一个规则,就可以智能识这绝大部分的文章内容呢? 您只需要接入我们的接口,就无需在为编写文章和图片类的页面而苦恼了。
了解咨询

雷达评级

A

用户规模

-

产品上线

-

网页正文抽取

接口地址
http://character.market.alicloudapi.com/extract
响应格式
application/json
请求方法
GET
请求参数 (Query)
参数类型必须描述
keystring
string
请求 AccessKey, 请在控制台中查看
urlstring
string
要抽取正文的url地址

产品亮点

速度快,可处理互联网上98% 以上的文章。

产品说明

 

 

 

【新闻、网页正文抽取】返回参数

名称 字段描述
content 正文
html 正文的html格式
img_list 正文中包括的图片列表
time 新闻发布时间
title 网页标题。
all_list 这是一个数组对象,包括了所有的文章段落以及图片。

 

 

 

产品参数

交付方式API

售后支持范围

1.工作日9:00~17:00远程技术、联调支持
2.服务质量问题可全额退款

产品资质