当前位置:首页 > 新闻资讯 > 技术分享 > 1千万多条隐私数据,谷歌“监视”我的这5年
马上就到5月了,有件大事要发生!
至于什么大事,先卖个关子,你只要知道因为它,Wendy扒出来了1000万条必哥的隐私数据。确切地说,是Google自2013年至今收集的他的所有数据,总之看到数据详细的我们是这个表情:
准备好和我一起体验不寒而栗了吗?
1. Google收集了哪些数据?——大揭底
首先我要告诉你,Google旗下的所有应用收集的数据会全部汇总到一起,你到这个网址去就能下载属于你自己的谷歌历史记录:takeout.google.com。
takeout.google.com
如下图,应用真的很多,还能继续往下拉。我选择把所有数据全部download下来,结果有40多个G!!!(似乎下载了一个世纪,明智如你记得自己下载时去掉图片)
所有会收集数据的应用
打包下载好后,你会看到一个非常详细的文件夹。下图是部分示例,毕竟我是来演示谷歌如何是收集数据的,不是来秀必哥隐私的。😏
下载后的文件夹
内容很多也很全,这里有两个文件包内容极其丰富,一个 takeout,一个 takeout 2,什么联系人、邮箱、书签,应有尽有,只要是你用过的应用,数据都收集好并分好类了。
YouTube文件夹
点击放大看上图,曾经用YouTube看过什么,订阅过什么,上传、下载过什么都有超级详细的记录,同理每个文件往下一层都有一个 html 或者 json 格式的记录可供查看。
不如我们往细了看必哥曾经在YouTube上的往事……
YouTube观看历史记录
YouTube搜索历史记录
Wendy直接拉到最底部,看到在YouTube里观看的第一条视频是在2013年11月30日,观看内容是MV《Wrecking Ball》哈哈哈……
再看历史搜索记录简直太可怕了,5年前搜索视频用过的关键词都还留着在!(“齐天大盛”是什么鬼……)
当然,紧接着我就去看了看Google搜索记录,整整21873条!!!5年里搜索过的两万多个关键词全!部!都!在!简直有种不堪回首的感觉😂
Google搜索记录
我还是找的最早的信息截图给大家看,2013年很久远,相信他不会那么介意。
接下来就有趣了,我找到一个文件里面有非常多非常多的音频文件,每个音频文件都很小,几十K的样子,播放之后你猜发现是什么?(坏笑)
是必哥调戏Google语音助手的全部录音!
对,必哥之前用的手机是Google家的Pixel,他很喜欢有事没事喊一句:“OK Google!” 要么打开音乐,要么打开地图,要么纯调戏,活像个反复跟语音助手掰扯发音的二傻子。
Google语音助手历史记录
你想想看,每一次语音唤醒的录音都留存着在,还转化为文本了,这到底是想干啥?所以只要你也用过,你每次对语音助手说过的话他全都记下来了!
几乎每个应用里都有一个「My Activity History」的记录,Google简直把数据化做到极致了有没有?只要是你产生过的数据,全部记录!全部留着!
再来最后一组数据示例哈,看图!
安卓应用历史记录
看到这里想哭,连这种活动都记录的清清楚楚,什么时候用过QQ,什么时候打开了支付宝,什么时候玩过“部落冲突”,统统都记下来,还存了这么多年,这是要上天的节奏啊……
2. 取证新思路——大数据公司是突破口
当然,从另一个角度来看,这无疑给了取证一个新的突破口,就是根据大数据公司提供的历史数据来分析嫌疑人的行为痕迹。
只要能够拿到账号密码,登陆下载的历史记录可能比嫌疑人自己本地的还要更全面更彻底!而且,还是已经分门别类做好归档的数据,分析起来简直零障碍!
还是拿必哥的历史记录做例子,在下载的数据包里,最为令人震惊的莫过于地理位置的轨迹记录了。于是我们将locationhistory.json文件扔到http://theyhaveyour.info/ 的位置分析网站。
http://theyhaveyour.info/网站页面
看到结果的感受无法用言语形容,我们看图吧。
中国境内历史轨迹
这一张是必哥中国境内的所有去过的地理位置轨迹图,可以看到最上面写着:从2015年6月25日至2017年6月2日,一共追踪了177, 089次!
湖北省内历史轨迹
武汉市内历史轨迹
放大到湖北省和武汉市内,轨迹点会更细,有星星的地方代表停驻的时间长,星星或点点越大,表示时间越长,由此就可以判断出来此人的常住地址、工作地址等。
不仅如此,还能看到必哥在2016年9月份去过澳大利亚,如果是嫌疑人突然离开常住地,这样的地址信息真的能给出不少线索。
澳大利亚历史轨迹
还没完,还有热力图可以查看,记不记得Wendy曾经在《!!!!!!》一文中讲过热力图啊,它能泄漏的信息可不少。
澳大利亚热力图
更让人崩溃的还有👇
飞行历史轨迹
对,通过坐飞机去过哪里,连往返方向和轨迹都画的很清楚、很明白……
全景图历史轨迹
嗯,我们直接求心理阴影面积吧。
对了,这个网站上还有通过时间搜索的功能,可以专门查看某个特定“作案”时间他在哪儿!
过滤搜索历史轨迹
该网站的分析是offline的,不用担心分享出去,所以大家感兴趣的话也可以试试,分析分析自己的历史轨迹。
如果所有的公司都提供了一个这样的接口,那意味着我们的取证工作将会多一种可能性,这样丰富而有规律的数据是很有价值的,分析起来也会很有效率!
3. GDPR的施行——个人数据保护革命
开篇我说有一个大事将发生,其实指的是GDPR法规将在5月25日开始严格执行!
GDPR是什么?就是欧盟制定的《通用数据保护法则》,这个法则于2016年定下最终稿,于2018年正式实施,欧盟给了所有的数据公司两年时间来准备和调整。(GDPR在之前的!!!!中讲过,戳它回去复习)
GDPR中很关键的一个规定就是:个人有权查看、下载、修改、删除任何公司收集的关于自己个人的信息。
这也就是为什么谷歌会给你一个下载数据的窗口,因为他们必须遵守这条规定,违反该条例的公司将面临重罚,嗯,这个重罚指的是2000万欧元或4%的营业额,两者中取更高价罚!像谷歌这样的公司,一罚估计就得几十个亿了。
前段时间有关Facebook的丑闻沸沸扬扬,Wendy也去看了看它是否也遵守了这项规定,用我们产品经理高帅B的Facebook账号试了一试,真的也找到了下载的地方!
下载下来的数据一样细致得令人吃惊,也是啥都有。
下载的Facebook数据
这就是传说中能影响政治选举的「点赞记录」!
当然,GDPR目前不会在中国执行,但其规定了:
除了在欧盟地区内的国家,其他国家即便不在该范围内,只要其公司有收集该地区内用户的个人数据,就必须遵守此项规定,厉害了有没有~
不知道有GDPR这样的法律先例,我们国家的隐私数据保护会有怎样的进步呢?
看了这么多数据,小编还很兴奋,目前亲试Google、Facebook、LinkedIn都是有这个下载接口的,有没有小伙伴有兴趣试下并分享一些其他的网站?等你哦!
对了,GDPR的全文已经给你准备好了,文末有链接直接点击下载详看吧。
欢迎投稿或商务合作
请联系邮箱:wendy@cflab.net
用最通俗易懂的语言
分享最专业严谨的知识
数据安全与取证
微信号 : Cflab_net
分享网络安全和取证知识的平台