在2018年开始,我们就开始存储网络上面的所有数据,我们数据监测范围覆盖网站、新浪微博、微信公众号(微信服务号)、论坛、贴吧、App、网络视频、电视、小红书、小视频(抖音、快手、小红书视频、哔哩哔哩、视频号、西瓜视频等19个小视频平台)、自媒体、报刊等全网信息,拥有丰富的数据字段,我们公司采集到的所有历史数据跟实时数据都可以通过API接口传输到我们客户的服务器,我们的所有API接口数据支持免费的测试体验。
数据总量超5000亿条,每日采集去重原创信息近5亿条
评论日采5000万+
全媒体覆盖:网媒、微博、微信、论坛、贴吧、APP、网络视频、电视、小视频、自媒体、报刊等
独立域名网站10万+
微博账号15亿全部采集
微信公众号2000万并在持续增长
贴吧、论坛全量采集
电视频道300+,涉及栏目6000档
APP客户端1000+
平媒电子版2000家
3200万+企业数据(工商信息、商标、专利、招聘、招投标、裁判文书、失信人)
覆盖京东、淘宝、天猫、亚马逊、一号店、当当、苏宁易购等主流电商平台
支持100+种语言自动翻译(多于Google翻译),包括少数民族语言翻译(藏语、维语、蒙语、哈萨克语、朝鲜语、壮语、彝语…)
测试流程:
1、提供需要测试的数据需求
2、拉技术群配合测试数据
API实时监测数据订阅
1、API舆情数据接口专题创建
基本信息
请求地址 :
https://dowding-gwa.*.com/api/v3/subscribe/subject/create
请求方式 (Method):
POST(请求参数放入Body中)
内容类型 (Content-Type):
application/json; charset=utf-8
接口说明
【使用方法】
请求头Headers:
‘Authorization’:’Bearer {Token}’ // headers添加参数: Authorization,请将其中的'{Token}’ 替换为您所使用的Token
【计费说明】
计费单位:条
说明:
1.使用创建接口创建专题时不会产生费用。
2.当数据满足设定的专题条件时,系统将为其打上相应的标签,并记录所产生的费用。
【专题响应】
普通专题:最晚5秒响应
高级专题:半小时响应(如果只改过滤条件,不改关键词逻辑的话也是分钟级)
【注意事项】
•专题个数计算规则: 启动专题的个数 + 停止专题的个数
•专题关键词数计算规则: 启动专题中的关键词个数和排除词个数 + 停止专题中的关键词个数和排除词个数
•编辑专题时的注意事项:
◦普通专题(triad模式)和高级专题(exp模式)不能同时使用。
◦在与过滤条件(filters参数)共同使用时,如果triad参数或exp参数输入错误导致不起作用,filters定向参数会独立运行。这样可能会导致大量非完整逻辑匹配的数据被推送。
◦请谨慎创建专题,以避免不必要的数据涌入和处理错误。
流控信息
QPS(请求频次)标准1次/s
账号所有专题数(个):≤100
专题数量计算规则:当前账号中已启动专题的数量 + 当前账号中已停止专题的数量
账号所有专题关键词(关键词+排除词):≤500
专题关键词数量计算规则:启动的专题中关键词和排除词的总数 + 停止的专题中关键词和排除词的总数
定向域名数量(个):≤50
定向域名数量计算规则:当前账号中已启动专题的数量 + 当前账号中已停止专题的数量
定向频道数量(个):≤50
定向频道数量计算规则:当前账号中已启动专题的数量 + 当前账号中已停止专题的数量
定向账号数量(个):≤50
定向账号数量计算规则:当前账号中已启动专题的数量 + 当前账号中已停止专题的数量
定向账号ID数量(个):≤50
定向账号ID数量计算规则:当前账号中已启动专题的数量 + 当前账号中已停止专题的数量
Kafka存储时间(天):≤3
Kafka存储时间(GB):≤50
2、API舆情数据接口专题编辑
基本信息
请求地址 :
https://dowding-gwa.****.com/api/v3/subscribe/subject/update
请求方式 (Method):
POST(请求参数放入Body中)
内容类型 (Content-Type):
application/json; charset=utf-8
接口说明
【使用方法】
请求头Headers:
‘Authorization’:’Bearer {Token}’ // headers添加参数: Authorization,请将其中的'{Token}’ 替换为您所使用的Token
【计费说明】
计费单位:条
说明:
1.使用专题编辑接口编辑专题时不会产生费用。
2.当数据满足设置的专题条件时,系统将为其打上相应的标签,并记录所产生的费用。
3.编辑专题后设置的专题条件更改,当数据满足更改后的专题条件时,系统将为其打上相应的标签,并记录所产生的费用。
【专题响应】
普通专题:最晚5秒响应
高级专题:半小时响应(如果只改过滤条件,不改关键词逻辑的话也是分钟级)
【注意事项】
•专题个数计算规则: 启动专题的个数 + 停止专题的个数
•专题关键词数计算规则: 启动专题中的关键词个数和排除词个数 + 停止专题中的关键词个数和排除词个数
•编辑专题时的注意事项:
◦普通专题(triad模式)和高级专题(exp模式)不能同时使用。
◦在与过滤条件(filters参数)共同使用时,如果triad参数或exp参数输入错误导致不起作用,filters定向参数会独立运行。这样可能会导致大量非完整逻辑匹配的数据被推送。
◦请谨慎编辑专题,以避免不必要的数据涌入和处理错误。
流控信息
QPS(请求频次)标准1次/s
账号所有专题数(个):≤100
专题数量计算规则:当前账号中已启动专题的数量 + 当前账号中已停止专题的数量
账号所有专题关键词(关键词+排除词):≤500
专题关键词数量计算规则:启动的专题中关键词和排除词的总数 + 停止的专题中关键词和排除词的总数
定向域名数量(个):≤50
定向域名数量计算规则:当前账号中已启动专题的数量 + 当前账号中已停止专题的数量
定向频道数量(个):≤50
定向频道数量计算规则:当前账号中已启动专题的数量 + 当前账号中已停止专题的数量
定向账号数量(个):≤50
定向账号数量计算规则:当前账号中已启动专题的数量 + 当前账号中已停止专题的数量
定向账号ID数量(个):≤50
定向账号ID数量计算规则:当前账号中已启动专题的数量 + 当前账号中已停止专题的数量
Kafka存储时间(天):≤3
Kafka存储时间(GB):≤50
API接口舆情数据实时搜索
1、API接口舆情数据标准search
基本信息
请求地址 :
https://dowding-gwa..com/api/v3/consult/search
请求方式 (Method):
POST(请求参数放入Body中)
内容类型 (Content-Type):
application/json; charset=utf-8
查看postman设置方法
接口说明
【使用方法】
请求头Headers:
‘Authorization’:’Bearer {Token)’ // headers添加参数: Authorization,请将其中的'{Token}’ 替换为您所使用的Token
【计费说明】
计费单位:条
说明:当用户请求标准search接口时,系统将基于接口实际返回的每条数据来计算费用。
【API说明】
用户可根据实际业务及对应条件,可搜索2014年到现在各个媒体类型的数据,根据关键词查询。接口支持查询境内多远数据,包含新闻、平媒、微博、短视频等主流媒体公开数据。
【使用场景】
1.搜索某一历史公开的新闻数据,获取数据内容 例如:查询2018-01-01 – 2021-12-31,关于北京故宫所有的资讯数据。
2.获取订阅专题中的数据 例如:需要导出检测专题中的数据,按照专题ID进行查询调取
备注:需查看数据总量,请调用 获取搜索总数
流控信息
QPS(请求频次)标准1次/s
最早查询时间:最早可回溯到2014年,默认为最近1年
单次查询任务返回最大条数:100条
单次查询最大时间跨度:7天
单次查询域名数量:≤50
单次查询频道数量:≤50
单次查询URL数量:≤50
单次查询账号数量:≤50
单次查询账号ID数量:≤50
搜索字数:≤100
2、API接口舆情数据获取搜索总数
基本信息
请求地址 :
https://dowding-gwa.istarshine.com/api/v3/consult/total
请求方式 (Method):
POST(请求参数放入Body中)
内容类型 (Content-Type):
application/json; charset=utf-8
接口说明
【使用方法】
请求头Headers:
‘Authorization’:’Bearer {Token)’ // headers添加参数: Authorization,请将其中的'{Token}’ 替换为您所使用的Token
【计费说明】
计费单位:次
说明:该接口调用一次会按照标准数据的多条计数,请谨慎试用;
如您对该接口可能存在的多条计数问题有任何疑问,请及时与我们的售前支持团队取得联系以便获得详细解答。
流控信息
QPS(请求频次)标准1次/10s
最早查询时间:最早可回溯到2014年,默认为最近1年
单次查询最大时间跨度:7天
单次查询域名数量:≤50
单次查询频道数量:≤50
单次查询URL数量:≤50
单次查询账号数量:≤50
单次查询账号ID数量:≤50
搜索字数:≤100
3、API接口舆情数据回溯历史数据-创建任务
基本信息
请求地址 :
https://dowding-gwa.istarshine.com/api/v3/kafka/task
请求方式 (Method):
POST(请求参数放入Body中)
内容类型 (Content-Type):
application/json; charset=utf-8
接口说明
将搜索获取的数据推入到客户制定的Kafka Topic中。
【使用方法】
请求头Headers:
‘Authorization’:’Bearer {Token)’ // headers添加参数: Authorization,请将其中的'{Token}’ 替换为您所使用的Token
【计费说明】
计费单位:条
说明 当创建回溯任务接口且满足以下三点时会记录费用:
1.HTTP状态码为200(表示请求已成功并且响应已准备好被使用)
2.响应中的代码(业务逻辑上定义的一个状态码)也为200
3.任务创建成功
数据返回字段参考
标准返回字段说明
流控信息
QPS(请求频次)标准1次/s
最早查询时间:最早可回溯到2014年,默认为最近1年
单次查询最大时间跨度:7天
最大创建任务个数:5个
单次查询域名数量:≤50
单次查询频道数量:≤50
单次查询URL数量:≤50
单次查询账号数量:≤50
单次查询账号ID数量:≤50
返回最大条数:≤100000
搜索字数:≤100