关键词:隐私信息;关心程度;关联分类
the users' privacy concerns about personal information arise with the emergence of the internet that also brings user's life many a questionnaire survey, this paper investigates the personal information concerned by users and the concern level employing the statistical analysis and associative classification technology. the result indicates that chinese internet user's concern level is still low although the concern level is much higher than ever. moreover, the concern level for different kinds of privacy information is distinct. the concern level to specific personal information is also varied ranging from the user's age, sex and education level. the conclusions provide some useful suggestions for electronic commerce sites to effectively protect the users' personal information.
key words:
一、引言
网络发展到今天,已经成为人们生活中不可或缺的一种工具。只需轻轻按动鼠标,人们即可随时随地购买所需产品或服务、与远在世界各地的亲朋好友交流、从事一些特殊的研究、培训或工作,还可以及时快速的了解世界各地的新闻,等等。但是,随着网络使用率的不断增高以及相关技术的不断进步,使得收集大量的用户隐私信息变得非常容易。federal trade commission (ftc) 在1999年3月所作的一次研究表明:约有92.8%的网站至少收集用户的一项身份信息,56.8%的网站至少收集一项人口统计学方面的信息[1]。网站和个人的这些收集他人隐私信息的做法引起用户对自己在网上活动时所留下的个人隐私信息的关心。harris 等人在1998年所作的调查结果显示:87%的网络用户“关心”在线时自己的隐私信息是否会受到威胁,56%的用户“非常关心”这一点[2]; jupiter 于2002年的研究结果表明:70%的美国用户关心自己的网络隐私[3];harris在2004的调查分析得出:65%的被调查者称自己由于关心自己的隐私而拒绝在电子商务网站上注册[4]。pc world survey于2003年调查了1500网络用户,结果表明88%的人对于网站是否分享他们的e-mail地址非常关心,91%的人关心当自己在线时会不会被网站跟踪[5];statistics canada 在2006年调查结果表明:57%的用户在线使用信用卡时非常谨慎[6]。与用户的隐私关注相一致,众多学者开始从理论角度对隐私问题进行探讨,得出了大量的研究成果[7-9]。
许多学者从不同的角度对隐私关心问题进行了研究。其中,大部分的研究是针对隐私关心和隐私行为之间的关系或隐私关心和信任之间的关系[9,10],这些研究仅对用户是否关心隐私进行调查,建立隐私关心和隐私行为或信任之间的关系,并未对用户具体关心的隐私信息及关心程度进行研究;huberman等人使用实验的方式对网络用户的隐私信息进行了定量研究,得出每项隐私信息都有一定的价值,且价值因用户不同而不同[11],但是并未说明各类用户的隐私价值在哪些方面存在差异。
中国在网络隐私权方面的研究越来越多,但是在隐私关心方面却鲜有研究。笔者针对这一情况,通过调查分析,找出网络用户所具体关心的隐私信息及关心程度,为后续更深入的研究网络用户对隐私关心程度不同的原因及其他相关问题提供参考。
笔者在此基础上认为,在中国文化的影响下,中国网络用户对于各项隐私信息的总体关心程度是不同的;此外,受性别、年龄和学历的影响,中国各类用户对于各项个人隐私信息的关心程度存在一定的差异。因此,笔者提出两个假设:(1)中国网络用户对每项隐私信息的关心程度是不同的;(2)不同性别、年龄、学历的用户对各类隐私信息的关心程度存在一定的差异。笔者采用问卷调查的方式,利用统计分析和关联分类的方法,对这两点假设进行研究。
二、研究方法
(一)问卷设计
笔者在参阅相关资料的基础上,重点研究网络用户的26项隐私信息,并将其分为人口统计学信息、财务信息、偏好信息、家庭信息、社会信息等五类信息(见表1),这5类信息的划分并没有明显的界限,有些信息可以同属两类信息,这对结果并没有明显的影响。
笔者采用问卷调查的方式进行研究。问卷共九个问题,每个问题都有被选项(单选和多选均有)。问卷。首先选择30人做预调查,对预调查的结果请相关领域的专家分析后进行了相应的修改。然后进行大范围的调查,被调查者为在校大学生、研究生、工程师、医生、教师、公务员等各个行业一共350人,其中在校大学生及研究生占整个被调查者的三分之一,收回问卷332份,回收率为94.86%,其中有效问卷为324份,针对这324份问卷做了分析。问卷的alpha系数为0.985。
参照中国互联网络信息中心(cnnic)对网民年龄的划分标准,考虑到不同年龄段的用户的生活背景,对网络的认识、接触网络的机会以及用途均不同,因此,为了了解各类用户对各类隐私信息的关心程度的差异性,对被调查者的年龄和学历进行划分,划分结果如表2所示。
(二)数据处理方法
1.统计方法
为了验证引言中所述的第一个假设,即网络用户对各项隐私信息的关心程度是不同的(网络用户对各项隐私信息关心程度的差异性),对调查结果进行了分析。由于个人信息项非常多,如果采用划分等级的方法(即请被调查者针对自己的每项信息都给一个关心等级,如“非常关心”“关心”“比较关心”、“不关心”),可能会使被调查者很难选择或者全都选 “非常关心”,因此请被调查者在所列出的26项个人信息当中选出不超过15项自己关心的信息,然后再对每项信息进行频数统计,得出用户对每项信息的关心程度(见表3)。
2.关联分类方法
为了验证第二个假设,得出不同用户对各项隐私程度关心程度的差异性,笔者采用关联分类的方式对数据进行了处理。
关联分类(associative classification, ac)是一类新的面向决策表的规则获取技术,其核心思想是利用关联规则挖掘技术,通过频繁项集挖掘、决策规则生成以及规则剪枝等过程获取条件属性与决策属性的关联关系,即决策规则 (称为分类关联规则(classification association rule) ),并利用生成的分类关联规则构建决策系统。研究表明,ac方法能够发现传统方法挖掘不到的规则[12-15]。因此,笔者以关联分类为工具,对用户的隐私信息进行分析,以便找出用户特征与其对隐私关心的联系,并且根据这种联系的强弱,得出用户对不同隐私信息的关心程度。在掌握网络用户对不同隐私信息的关心程度之后,商务网站可以有针对性的重点保护网络用户比较关心的个人隐私信息,提高用户对网站的信任水平,为企业创造更多的商机。
三、结果
(一)网络用户对隐私信息的关心程度
根据表3结果,将关心程度分为四个等级(非常关心、关心、比较关心和不关心),关心程度值大于0.7的为“非常关心”,关心程度值大于0.5的为“关心”(其中“家庭信贷情况”这项信息的关心程度值为0.494,非常接近0.5,所以将其划分到“关心”这个等级),关心程度值大于0.2的为“比较关心”,小于0.2的为“不关心”,根据每项隐私信息的关心程度值将其放入相应位置,建立了个人隐私信息的关心程度矩阵(表4)。
虽然近几年中国网络用户的隐私观念有所改变,但从表3可以知道,中国网络用户对个人隐私信息的关心程度依然不高,仅对银行卡号和身份证号这两隐私信息的关心程度超过了0.6。这主要是受中国传统文化的影响[16]。
为了更进一步的解释假设一,下面笔者对每类隐私信息的关心程度进行简要分析。
1.人口统计学信息
从表3中可以看出,网络用户最关心身份证号这项信息,其次是姓名和年龄,而对性别、身高、体重等信息则不关心。
在我国,身份证号是确定一个人身份的重要证件,如果此项信息泄露,可能会对个人造成非常大的损失或带来许多麻烦,所以用户对此项信息的关心程度非常高是符合实际情况的。由于其他五项个人人口统计学信息仅为用户个人的信息,不涉及到他人,而且即使泄露,一般也不会对用户本身或他人造成较大损失,所以用户对这些信息的关心程度很低。此外,在网络世界中,为了更好更容易地与他人交流沟通,大部分用户都隐藏自己的真实姓名和年龄,所以对这两项信息的关心程度要稍微要高一些。
2.财务信息
从表3中可以看出,对于各类财务信息,用户均很关心,关心程度最高的是银行卡号,其次是个人工资、家庭收入、配偶工资和家庭信贷情况等隐私信息。
对于财务信息,不论在中国还是其他国家,网络用户都都非常关心。因为这类信息涉及到用户的经济情况,如果泄露,会对个人经济造成极大损失,尤其是银行卡号,在信息技术如此发达的时代,黑客等网络高手可能会根据用户的银行卡号来窃取用户的钱财,所以用户对银行卡号的关心程度在所有隐私信息中是最高的。至于其他四项财务信息,相对其他类的个人信息来说,关心程度也要高一些。在这四项信息中,值得注意的是个人工资这项信息,在五年前,中国人并不关心这项信息是否泄露,甚至很多人主动告诉他人自己的这项信息,但随着社会的进步、经济水平的提高和用户观念的转变,近几年越来越多的用户开始关心自己的这项隐私信息。
3.个人偏好信息
从表3中可以看出,对于个人的各项偏好信息,用户普遍都不关心。因为这类信息仅仅是个人的兴趣爱好,即使泄露,也不会对他人造成损失或伤害,一般也不会给个人带来影响,所以用户对这类信息的关心程度都很低。
值得注意的是,年龄在31-35岁之间的人,对自己的政治倾向和宗教信仰这两项信息的关心程度要高出其他信息许多(其他信息关心程度在0.8以下,而这两项信息均约为0.4)。这是因为,处于这一年龄段的用户,工作已经进入快速发展期,生活阅历又比较丰富,已经认识到政治问题和宗教问题可能会对自己的工作产生影响,所以对这两项信息的关心程度相对来说要高一些。
4.家庭信息
同样从表3来看,对于各类家庭信息,网络用户同样比较关心,但相比来说,更关心庭住址和家庭电话这两项信息。
从古至今,家庭对中国人的意义和影响都非常大,这类信息的泄露,极有可能会给用户及其家庭带来极大的麻烦甚至伤害,尤其是家庭住址和家庭电话这两项信息,直接关系到家庭的安全和稳定,所以网络用户在对各类家庭信息都很关心的情况下,对这两项家庭信息的关心程度要更高一些。
5.社会信息
对于个人的各类社会信息,从表3中可以看出,用户一般比较关心自己的网络聊天记录和个人移动电话这两项隐私信息,其次是个人e-mail地址,而对职业、单位地址和单位电话等隐私信息则不关心。
网络聊天记录这项信息,一般涉及到朋友或同事的隐私信息,如果泄露可能会给自己的人际关系带来影响,甚至影响到自己的工作,所以用户对这项信息的关心程度比较高。而个人移动电话的泄露会给个人带来很多麻烦(如经常接到骚扰电话或短信息),所以用户对这项信息的关心程度也比较高。
(二)各类用户对各类隐私信息的关心程度比较
在(一)中我们从总体上得出了网络用户对个人信息的关心程度,并对各类隐私信息的关心程度进行了简要分析。为了更进一步的了解各类用户对个人各项隐私信息的关心情况,笔者采用关联分类的分析方法得出了各类用户对各项信息的关心程度的规则。
使用关联分类分析方法会得出很多的规则,因为篇幅有限,根据网络用户的性别、年龄和学历的不同,仅列出有代表性的规则,并对产生这些规则的原因进行简要解释,希望能为进一步研究引起这些现象的深层次原因,如文化因素、社会环境、个人偏好等,提供有益的启发。
表格5到7中的用户类别用年龄、性别和学历三个属性来来划分,表示方法为﹡﹡﹡,左边﹡表示年龄段,中间的﹡表示性别,右边的﹡表示学历,如c1ⅰ表示年龄在25到30岁之间、性别为男性的具有本专科学历的用户。
1.不同年龄用户对隐私信息的关心程度
如2.1中所述,不同年龄段的网络用户的社会经历不同,随着年龄的增长,对事务的认识和看法也不同。针对这一现象,笔者从分析结果中找出了不同年龄的用户对隐私信息的关心程度的差别(见表5)。
规则1 年龄在25到30岁的女性用户比年龄在21到24岁的女性用户更关心年龄这项隐私信息。这是因为无论在中国还是西方国家,女性对年龄这项信息都比较敏感,尤其是年龄越大的人,对这项信息越敏感,所以得出了此项规则。
规则2 同样具有本专科学历的男性,年龄在25到30岁的人比年龄在21到24岁的人更关心个人工资、家庭收入和详细健康状况这三项隐私信息。在本问卷的被调查者中,约有三分之一的被调查者为在校学生,所以年龄在21到24岁的男性大部分为在校学生,而年龄在25到30岁的男性基本都为从事工作的人,处于这一年龄段的人一开始承担家庭的各项经济支出,所以对个人工资和家庭收入这两项信息更为关心。同时,由于健康状况可能会影响到自己的工作和家庭,所以他们对自己的详细健康状况这项信息的关心程度也比较高。
规则3 年龄在31到35岁的人比年龄在21到24岁的人更关心婚姻状况和家庭电话这两项隐私信息。由于前者基本都为成家立业的人,后者大都为在校学生,后者对婚姻和家庭尚未具体的理解和经历,所以后者对这两项信息的关心程度比较低是很正常的现象。
规则4 对于职业这项信息,网络用户都不关心,但相比来说,年龄在31到35岁的人比其他年龄段的人更关心。由于小于此年龄段的人一般都未开始工作,即使工作也是刚刚起步,而大于此年龄段的人一般工作年限已比较长,工作已经有了一定的基础并且比较稳定,而处于31到35岁的人正处于工作的重要阶段,所以对于这项信息比较敏感,关心程度也较高。
2.不同性别用户对隐私信息的态度
一般来说,男性和女性在人生观、世界观、价值观方面的差异都比较大,为了了解不同性别的用户对隐私信息的态度存在哪些方面的差异,笔者对结果进行了分析,得出以下规则(见表6)。
规则5 女性比男性更关心年龄、体重、详细健康状况和家庭情况。如前所述,中西方国家的女性对年龄、体重这些信息都很敏感,所以对这两项信息的关心程度比男性要高,至于更关心详细健康状况这项信息,是因为女性一般体质弱于男性,所以对该项信息更为敏感。此外,在中国,女性的家庭观念更强,所以对家庭情况这项信息也比男性更关心。
规则6 男性比女性更关心姓名、性别、家庭住址、家庭电话。一般来说,在网络世界里,女性要比男性更容易与他人沟通交流,而从姓名可以大致判断性别,所以为了更方便的在网络世界里与他人沟通,男性一般都隐瞒自己的性别,即对姓名和年龄这两项信息的关心程度比女性高;此外,无论在中国还是西方国家,男性一般要承担起保护保护家人的责任,而家庭住址和家庭电话这两项信息的泄露可能会给家人带来麻烦或危险,所以男性对这两项信息的关心程度比女性高。
规则7 年龄在25到30岁之间的男性比女性更关心家庭信贷情况这项信息,但年龄在21到24岁之间的具有本专科学历的女性却比男性更关心此项信息。处于前一年龄段的人一般为刚成家立业的人,在中国,历来有男人养家的传统思想,所以处于这一年龄段的男性要比女性更关心自己的家庭信贷情况;而处于后一年龄段的人大都为在校学生,而女性一般比男性心思更加细腻,对父母更加体贴,所以处于这一年龄段的女性更关心家庭信贷情况是出于对父母的关心。
3.不同学历用户对隐私信息的态度
不同学历的人,所受的教育程度不同,一般在对问题的认识深度等方面会存在一定的差异。笔者从分析结果中找出了不同学历的用户在隐私信息的关心程度方面的差异(见表7)。
规则8 具有本专科学历的女性比具有硕士学历的女性更关心身高这项信息,而后者更关心配偶工资和网络聊天记录这两项隐私信息。一般来说,女性对身高并没有男性关心程度高,但是对于具有不同学历的女性来说,在学历上具有优势之后,对身高这项信息的关心程度自然也就没有在学历上具有弱势的女性高;至于配偶工资这项信息,如果女性本身的学历比较高,一般都希望配偶的工资能更高,所以对该项信息的关心程度也就比较高;此外,由于在校学生在本次调查中所占比例比较大,而在校本专科学生一般将网络用于沟通交流和娱乐,而在校研究生除了将网络用于交流沟通娱乐外,最主要的一点是用于做研究,从网络聊天的内容价值来看,硕士研究生的聊天内容价值更高,更需要保密,所以出现具有硕士学历的女性比具有本专科学历的女性更关心网络聊天记录这项隐私信息。
四、讨论
笔者采用问卷调查的方式获得了用户对于自身隐私信息的关心程度,并采用关联分类的方式分析了各类用户对于各项隐私信息的关心程度的差别,分析结果验证了引言中提出的两项假设。
如前所述,对于网络隐私问题,研究的人很多,但主要集中在隐私保护技术、隐私关心和隐私行为之间的关系或隐私和信任的关系问题或隐私权问题上。笔者主要是从用户自身观念出发,旨在了解用户到底对自身的哪些信息比较关心。此结论可以为电子商务网站服务,网站在了解用户关心的各项信息后,可以加强对这些信息的保护,从而提高用户对网站的信任水平,给网站带来巨大商机。但是尚存在一些问题,一是调查的信息项仅26项,有许多信息没有调查;二是样本仅350人,且样本年龄跨度小(如调查的年龄主要集中在20-35岁之间),涵盖的范围不够宽;三是在分析用户对信息的关心程度时仅采用频数分析,结果可能存在不合理的地方;四是关于各类用户对各类信息的关心程度的差别仅得出一些结论性的结果和简单的分析。
目前,关于隐私问题的研究越来越多,也越来越深入。但仍有许多问题值得进一步研究:(1)对本文未作调查的个人隐私信息需要调查研究,得出用户对这些信息的关心程度(本文只是对小部分信息进行调查,不完全,还需要进一步做详细的研究);(2)虽然由调查结果得出的规则可以看出用户对于各种信息的关心程度是不同的,但是对产生这些规则的圆满解释还需进一步的研究;(3)得出用户对于各项信息的关心程度之后,电子商务网站如何利用这些结果提高用户的信任水平也是值得研究的内容之一。
参考文献:
[1] forrester research(1999). post-web retail (september) [r/ol]. /
[2] harris and associates inc., westin, a., 1998. ecommerce and privacy: what net users want. privacy and american business and pricewaterhouse coopers. llp. available online at: /. accessed on 20 june 2005.
[3] jupiter research. seventy percent of us consumers worry about online privacy, but few take protective action [eb/ol], 2002. /xp/jmm/press/2002/pr_060
[4] harris, 2004. national survey on consumer privacy attitudes. available online at: /privacy/survey/s, accessed on 22 august 2006.
[5] pc world survey, 2003. available online at: /article/id,112468-page,, accessed on august 22, 2006.
[6] statistics canada, 2006. available online at: news/newsarticle, accessed on august 22.
[7] klein, s.,. the privacy debate: this time it's personal. the guardian newspaper, april 26. 2004.
[8] vise, d.,. fears over big brother stalked gmail. the sunday times news paper. available online at:[eb/ol]article/, accessed on 8 december 2005.
[9] carina painea, ulf-dietrich reipsb, stefan stiegerc, adam joinsona, tom buchanan. internet users' perceptions of 'privacy concerns' and 'privacy actions' [j]. human-computer studies2007.65(526-536).
[10] chang liu, jack t. marchewka, june lu, chun-sheng yu. beyond concern-a privacy-trust-behavioral intention model of electronic commerce[j]. information & management 42 (2005) 289-304.
[11] huberman b, adar e, fine l. valuating privacy [j]. ieee security&privacy, 2005: 22-25.
[12] thabtah f, cowling p, hammoud s. improving rule sorting, predictive accuracy and training time in associative classification [j]. expert systems with applications, 2006(31): 414-426.
[13] liu b, hsu w, ma y. integrating classification and association rule mining [c]. proceedings of the fourth international conference on knowledge discovery and data mining (kdd-98), 1998.
[14] antonie m, za?ane o, coman, a. associative classifiers for medical images [m]. lecture notes in artificial intelligence 2797, mining multimedia and complex data. new york: springer, 2003, 68-83.
[15] yin x, han j. cpar: classification based on predictive association rules [c]. proceedings of 2003 siam international conference on data mining (sdm'03), 2003, 369-376.
[16] 张梦.中美两国文化中的隐私观念比较[j].河南师范大学学报(哲学社会科学版).2006,33(5):37-39.
中国论文网(www.lunwen.net.cn)免费学术期刊论文发表,目录,论文查重入口,本科毕业论文怎么写,职称论文范文,论文摘要,论文文献资料,毕业论文格式,论文检测降重服务。