全国电子音乐交流中心

关于网站跟踪:你应该知道的技术与隐私

21CTO2020-06-29 09:09:48

21CTO社区导读:Facebook的隐私丑闻爆发让我们所有人都开始关注和讨论互联网隐私权的问题。包括国内百度、今日头条对网络隐私数据的使用问题。


在本篇中,我们来解释网站跟踪的工作原理。



在本文中,我们一起会了解到如下主题:


1、什么是网站跟踪,它是邪恶的吗?

2、第一方和第三方网站跟踪

3、跟踪的技术机制

4、如何跟踪网络跟踪器


一、什么是网站跟踪(Web Tracking)


人们在使用互联网时,我们都会在访问过的网站中留下记录,包括点击后的商品等事物。大多数网站都会在页面嵌入一些代码,用来跟踪访问者,如行为数据,还有用户帐号和其它软硬件配置信息。


有关这方面的详细信息在“跟踪机制”部分进行介绍。


为什么要这么做?


从网站运营者角度来说,跟踪后的数据提供了一些有价值的内容,包括个性化、网站分析以及个性化广告。


如果没有跟踪功能,电子商务网站就像瞎子一样,把所有访客当成陌生人,也没法呈现个性化内容。


二、网站跟踪器是邪恶的吗?


网站跟踪器肯定不是100% 存在恶意,但人们对其运作原理仍然知之甚少。当我们有时浏览切换多个网站后,可能你会到页面中的广告就是你几周前或近期看过的商品。这是为什么?其实最大的隐忧就是第三方网站的追踪器。


我们看下面的图片,某条Twitter有多少信息是被 Google 和 Facebook 收集的。



第一方与第三方网站跟踪


比如你去sina.com,渣浪会知道你已经来过,并且知道你正在读哪篇文章,发布神马评论。在这种情况下,Sina网站叫做“第一方”。


我们选择访问了第一方网站,一般不会注意它们收集了我们哪些访问记录。新浪的某个子页面会嵌入像dobleclick.net的第三方跟踪代码,如果要显示用户个性化的网络广告,就需要记录用户在sina网站的访问情况。


任何网站中的追踪数据取决于网站运营团队的目标与决策。


什么是第三方跟踪?


第三方跟踪是指用户直接访问网站以外的网站跟踪或协助用户访问网站的做法。


第三方跟踪器有时是让人担心的,为什么?


一旦页面有一个第三方跟踪代码,这个第三方就有能力转向并邀请任意数量更多第三方一起加入第一方的网页。


我们的个人信息是有价值的,我们应该有权知道网站正在收集哪些数据,我们的年龄、收入,家庭情况与收入,病史、饮食习惯、喜欢的网站、生日、卡号...等。


第三方平台会收集这些数据与利益方合作,帮助他们用新的方法来说服我们花钱,注册服务,下载APP等。


如果我们想放弃这些信息以获得利益,那么除了广告以外,我们可能看不到其它的内容。


跟踪并不是匿名的


图3 大多数网站并不是匿名跟踪,没有人知道你是一条狗是个玩笑


你可能认为跟踪是匿名的,好像你的真实姓名并没有在上面,但是大多数第三方都知道你的真实身份。


比如Facebook充当第三方追踪时,只要您创建了Facebook帐号登录后,即使你尚未登录,他们也知道你的身份。


通过算法利用其浏览历史记录与其社交媒体配置文件之间的统计相似性,跟踪器也可以对用户进行匿名化。


可见的第三方跟踪器


尽管大多数第三方都是不可见的,但可见页面元素(如Facebook Like按钮,嵌入式Twitter提要以及各种其他商业小程序都是第三方跟踪的模式。


跟踪的技术机制


以下是最常见的追踪机制:



Cookie,信标(beac)和指纹识别 - 跟踪机制


Cookie是识别用户的最广为人知的方法。他们通过Web服务器投放在用户浏览器中的小块数据(每块数据限制在4KB)。当用户首次访问网站时,具有唯一的用户标识符(可以随机生成)的Cookie文件就被“种植”在用户的电脑上。


如果随后访问Facebook网站,它并不需要你登录,因为你的详细信息通过浏览器第一次登录时存储的cookie中已经记住了。


浏览器指纹识别是一种非常准确的方式,可以在用户上线时识别和跟踪用户。它收集的信息非常全面,通常包括浏览器类型和版本,操作系统和版本,屏幕分辨率,支持的字体,插件,时区,语言和字体首选项,甚至包括你电脑的硬件配置。


这些标识符可能看起来很平常,根本没有个人识别。但是一般在数百万人中只有一个与你具有完全相同的配置。


网络信标非常小,通常隐藏在网页或邮件中。网络信标也被称为“网络臭虫”,它也通过名称“tag”,“metag tag”,“trac error”,"piex.gif”等方式嵌入在页面中,一般人不会觉察发现。


这种最简单的形式,常在EDM中使用,它们通常是特别微小的图片,通常是单个像素的大小。它们在加载网页时以图像的形式下载,或者打开电子邮件,向图像的远程服务器发送消息。服务器脚本会提醒公司他们的电子邮件刚刚打开或访问了他们的某个网页。


这就是为什么您不应该在来自您不信任的发件人的电子邮件中显示图片的原因。


网络信标也被在线广告商使用,广告商将他们嵌入到他们的广告中,以便他们可以独立地跟踪广告的展示频率。


如何追踪追踪者!


去年,我通过Outreachy计划在Mozilla实习。我用了一种名叫Lightbeam的工具。此隐私浏览器扩展可帮助您在浏览网页时发现谁正在线跟踪我。


来自Lightbeam的可视化显示第一方和第三方跟踪器


当你激活Lightbeam并访问网站时,浏览器扩展会创建该页面上所有第三方跟踪器的实时状态,并且是可视化的。当你浏览到第二个网站时,它会突出显示那些也在此时活跃的第三方跟踪器,并显示哪些第三方在这两个网站上监视到了你。 可视化图像与你访问的每个站点以及浏览器发出的每个请求同步增长。


作者:Princiya。开发者,演讲者,思想家,美食家和旅行爱好者

编译:洛逸

来源:https://medium.freecodecamp.org/what-you-should-know-about-web-tracking-and-how-it-affects-your-online-privacy-42935355525