为啥小红书评论数据舆情监测软件厂商表示无力?

甲鱼舆情监测软件 上海舆情监测

为啥小红书评论数据舆情监测软件厂商表示无力?

最近很多朋友向小编咨询小红书评论数据采集的问题,但是他们不问小红书主帖采集的问题,说明目前国内大部分舆情监测软件厂商都攻破了小红书主帖的采集,主要还是时间快慢,采集全面不全面的问题。那么为什么评论这么难采集了呢?今天小编就来详细给大家介绍一下行业小红书评论采集的情况

1、大部分舆情监测软件厂商都可以采集小红书评论数据,但是大部分舆情监测软件厂商采集到的评论数据都不全,连10%的评论数据都不到。

2、舆情监测软件采集小红书网站评论主要有3种途径:

A、采集主帖的时候,主帖下面的评论顺便采集

B、采集某些账号的评论数据,其它账号的评论不采集

C、采集一些小红书推荐,热度比较高的帖子评论,毫无章法,随便采集

那么问题来了,既然小红书的评论数据可以采集,那么为什么有这么多的需求,国内的舆情监测软件厂商或者专业的爬虫机构不去爬这一块的数据呢?

主要是成本太高了,就拿目前采集小红书主帖的成本来说,如果一天是100元,那么如果要采集所有评论的数据至少要1万元以上的成本,付出这么多,回报率远低于付出,而且小红书动不动就封IP池,动不动做反爬虫技术,所以目前国内没有哪个公司敢冒这个风险来干这个事情。

如果要爬小红书全量评论数据,该怎么做呢?》

1、整备目前10倍的IP池

2、梳理小红书所有账号,定向爬这些账号的评论数据;或者梳理出小红书主帖信息,定期爬这些信息的评论信息。就算爬到了评论信息,时效性也是非常非常低的。

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注