学术研究人员倾向于更多的非传统的数据采集方法,转向Facebook和Twitter等社交媒体网站的信息。从麦吉尔大学和卡内基梅隆大学的计算机科学家,然而,警告可能的缺陷在处理大数据集时从社交媒体。
德里克。露丝,从麦吉尔大学计算机科学学院的助理教授,错误的结果将有重大的影响,每年有成千上万的研究使用社交媒体数据。这些研究反过来用于通知和证明决策在各种组织中,私人部门和公共以及政府所以没有犯错的余地。
露丝和尤尔根•菲在卡内基梅隆大学软件研究所,他们的研究结果发表在《科学杂志。根据他们的研究,一些问题关于使用社会媒体数据需求的关注。
露丝和菲确认问题在他们的论文中包括:
- 不同的社会媒体平台有不同的用户(可能歪曲人口样本);
- 公开的数据并不总是代表一个平台的整体数据准确(研究人员不知道如何以及何时社交媒体网站过滤信息);
- 社会媒体平台是如何设计可以控制用户行为,实际上,这样的可测量的行为(没有Facebook的“喜欢”按钮,只能检测到通过积极回应“喜欢”);
- 并不是所有的用户都是真实的人(收集的数据包括机器人“美联储”的信息和垃圾信息散布者);和
- 结果通常是取自easy-to-classify话题,事件和用户,使方法看上去比现实更准确推断出政治取向为典型的Twitter用户几乎达到65%的准确率,但研究政治活跃用户要求准确率高达90%)。
幸运的是,这些问题已经从其他领域知名的解决方案开发机器学习、统计学和流行病学。露丝补充说,常见的问题是什么,研究人员需要更加意识到他们的信息收集和分析的数据是否可靠。
早在1948年,一个臭名昭著的整体推动社会人员磨练他们的标准和技术,将今天的领域。万博体育登录首页现在社交媒体数据构成挑战的问题,虽然不同于65年前,提供社会研究人员一个机会再次设置更好的标准。
“通过解决我们面临的问题,我们就能实现良好的承诺的社会媒体的巨大潜力研究,“说露丝。
ⓒ2023 T万博体育登录首页ECHTIMES.com保留所有权利。不复制未经许可。