中国高校技术创新溢出研究
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.3 研究设计

1.3.1 研究方法

在研究方法的选取上,主要从地理学的视角出发,采用理论阐述与实证分析相结合、定性分析和定量分析相结合的方法。

(1)文献和文本分析法

文献研究是进行科学研究最基础的方法。主要通过CALIS外文期刊网、中国知网(CNKI)数据库,对相关的地理学、管理学、经济学和教育学等多学科的大量文献进行检索、阅读,并紧扣研究主题,结合最新研究进展,梳理和提炼出研究的理论框架和理论依据。另外,在中国高校技术创新溢出模式与机制的分析中,根据样本企业,主要通过企业网站查询形式,结合社会网络分析结果,总结分析中国高校技术创新溢出模式及其机制。

(2)专利信息数据分析法

专利信息数据分析法主要包括定性分析法、定量分析法、拟定量分析法和专利地图分析法等。

①定性分析法。主要指通过对专利信息的内容进行归纳、分析,了解某一技术当前状况以及未来前景的方法。定性分析主要是围绕特定的技术主题,分析专利的技术内涵,判断专利的重要性,确定区别出基本专利和派生专利。这是对专利信息的深层次利用,具有很强的学科专业性,一般由该学科领域的专业技术人员与专利信息服务专业人员来进行合作。常见的有专利技术功效矩阵分析、权利要求范围构件分析等。(51)

②定量分析法。主要是对专利数据进行统计分析,依据定义的指标,统计的内容十分广泛,如技术发展阶段测量法、技术生命周期分析法等。在专利的数量方面,主要有国家、区域、机构的专利产出、专利的技术领域与主题分布、专利数量随时间的变化、专利申请率、授权率、专利申请的变化情况等。在专利质量考察方面,主要有专利引用与被引用情况及衍生指标的计算等。其他研究也涉及专利与科技指标,以及与经济指标关联的定量统计分析等,如技术研发效率、科学与技术的联系等。统计分析根据不同的研究目标,选择不同的统计方法,常见的有时间序列法、概率统计模型、线性回归法、计量经济模型、矢量动态模型等。(52)

③拟定量分析法。专利拟定量分析法,是专利定量分析与定性分析相结合的分析方法。由于专利信息分析的目的,以及定量、定性分析方法间的有机联系,专利拟定量分析成为一种常用的重要分析方法。专利拟定量分析通常由数理统计入手,然后进行全面、系统的技术分类和比较研究,再进行有针对性的量化分析,最后进行高度科学、抽象的定性描述,使整个分析过程由宏观到微观,逐步深入地进行。如专利引文分析方法与专利数据挖掘,都是常见的拟定量分析方法。(53)

④专利地图分析法。是对专利信息加以收集、整理、加工、分析,然后以视觉直观的方式构建图形、表格、曲线等来揭示专利信息的内涵、联系、规律与本质的分析方法。(54)

从创新外溢的路径来看,“技术贸易和技术合作是两种典型的技术溢出路径,这两种路径事实上是创新外溢最强的形式”。(55)研究借助专利信息数据分析方法,对国家“211工程”高校与企业合作申请发明专利,以及这些高校向企业转移发明专利情况进行分析,探究中国高校技术创新溢出空间格局的演变。

(3)社会网络分析法

社会网络分析法是一种基于图论思想,针对关系型数据进行分析的社会学研究方法,既能分析关系网络的结构问题,还可深入探讨网络特征与个体属性的关联,社会网络分析法已经成为近年来关于合作关系研究的主要途径。社会网络分析方法广泛应用于文献计量,如引文分析,专利、论文合著网络等方面的研究。(56)用于社会网络分析的常见软件是Ucinet,该软件集成了Netdraw(可视化)和Pajek(网络分析)等工具包,可对中心性、凝聚子群、关联性等多项指标进行分析。(57)

①平均路径长度。表示的是网络中任意两个节点(行动者)之间距离的平均值。表示为。其中dij表示节点ij之间的最短路径长度,是连接两个节点之间边数最小的路径数。

②聚类系数。用来衡量社会网络中两个邻居节点的有链接的概率,表示网络中行动者之间关系的紧密程度。给定节点i的度为ki,在ki个邻居中存在最多条边。在实际网络当中,节点ki的聚类系数为

③幂率度分布。对度的研究是对网络结构研究的重要组成部分,Barabasi对度的研究表明,网络中节点点出度和点入度不服从均匀特征的幂律分布,通过幂律分布原理构建了无标度网络模型。幂律分布形式为:P(k)~k-r。其中r>0为幂指数,取值一般小于3,随着幂指数的增大,网络的高度非均匀的网络变化为均匀网络。(58)

④度数。一个点与其他点直接相连的线的数量,就是一个点的度数。有向图中点的度数需要从两个角度判断,点入度(in-degree)就是指向点的线数总和,点出度(out-degree)指由该点出发的指向其他点的线数总和。(57)表示为:di=Eij

⑤密度。以数学方式来解释,一个图的密度是图中实际存在的连线数与最大可能连线数之间的比值。密度描述一个图中各个点之间关联的紧密程度,各个点之间越相关,图的密度越大。密度可以从整体网和个体网两种角度区分,整体网密度将网络看作一个整体来观察网络中的关联模式,个体网络密度是围绕特定的行动者的关系密度。(59)

⑥中心性。在社会网络分析中,中心性是衡量节点在网络中的位置的重要指标,是衡量节点的主要依据。使用中心性指数对权力进行衡量主要有三种途径。(a)点度中心性,表示一个节点直接相连的其他节点的点数,显示节点的交往能力;(b)中介中心性,表示一个节点处于其他节点之间最短途径上的程度,侧重于衡量节点对其他节点的控制能力。(c)接近中心性,所谓节点的接近度是指节点到所有其他节点的最短路径之和。(60)

⑦互惠指数。互惠指数是刻画有向网络的无向化程度,其定义为网络中两个相互关联的节点所占的百分比,互惠指数R的值介于[0,1]的范围之间。根据互惠指数,可以区分网络派系。(61)

⑧凝聚子群。社会网络分析中的凝聚子群研究是一种量化的社会结构研究,旨在区分关系网络中的群体,以洞察网络的结构。(62)

⑨网络规模。网络规模是指网络中结点的个数。

研究中,选取相关指标对国家“211工程”高校与企业合作申请专利,以及学校向企业转移专利的情况,进行社会网络分析研究。

(4)SPSS主成分分析法和熵值法

①SPSS主成分分析法。根据数据校验的有效性结果(63),借助于SPSS统计工具软件的主成分分析法主要有如下五个步骤。(64)

(a)对指标的原始数据无量纲化。设有n个样本,p项指标,可得数据矩阵X=(Xijnxpi=1,2,…,n表示n个样本,j=1,2,…,p表示p个指标,Xij表示第i个样本的第j项指标值。(65)用Z-score法对数据进行标准化变换,得出:

式中,l=1,2,…,nj=1,2,…,p

(b)计算其相关系数矩阵。R=(rjkpXpj=1,2,…,pk=1,2,…,prjk为指标j与指标k的相关系数。(66)

,即:Zjk

rii=1,rjk=rkji=1,2,…,nj=1,2,…,pk=1,2,p。

(c)求出各特征向量。由特征方程|λIp-R|=0,可求得p个特征根λg(g=1,2,…,p),λ1将其按大小顺序排列为:λ1≥λ2≥…≥λp≥0,它是主成分的方差,它的大小描述了各个主成分在描述被评价对象上所起作用的大小.由特征方程,每一个特征根对应一个特征向量Lg(Lg=lg1,lg2,…,lgp),g=1,2,-,p。(67)

将标准化后的指标变量转换为主成分:

Fg=lg1Z1+lg2Z2+lgpZp(g=1,2,…,p)。

F1称为第一主成分,F2称为第二主成分,…,Fp称为第p主成分。

(d)根据因子累积方差贡献率选出主成分。一般主成分个数等于原始指标个数,如果原始指标个数较多,进行综合评价时就比较麻烦。主成分分析法就是选取尽量少的k个主成分(k<p)来进行综合评价,同时还要使损失的信息量尽可能少。(68)

k值由方差贡献率决定。

(e)以各主成分的方差贡献率为权数,将所选取的主成分进行综合评价。先求每一个主成分的线性加权值Fg=lg1 Z 1+lg2 Z 2+…+lgpZp,g=1,2,…,k,再对k个主成分进行加权求和,即得最终评价值,权数为每个主成分得方差贡献率:

最终评价值为:(69)

研究中对高校科技创新能力评价采用了SPSS主成分分析法。

②熵值法。在综合评价指标体系的测度中,确定指标权重的方法主要有主观赋权法和客观赋权法。熵是源于热力学的一个物理概念,后由申农(C.E.Shannon)引入信息论,现已广泛运用于社会经济等研究领域。在信息论中,熵是系统无序程度的度量,信息则是系统有序程度的度量,两者绝对值相等,符号相反。

一般认为,某项指标的指标值变异程度越小,熵值越大,该指标提供的信息量越小,指标的效用价值越小,权重也越小;反之,某项指标的指标值变异程度越大,熵值越小,该指标提供的信息量越大,指标的效用价值大,权重也越大。因此,熵值法是客观赋权法的重要方法,能够深刻反映出各指标的效用价值,其计算主要包括如下七个步骤。(70)

(a)构建原始指标数据矩阵。假设有m个样本,n项评价指标,形成原始指标数据矩阵X={xij}m×ni=1,2…,mj=1,2,…,n),则xij为第i个样本第j个指标的数值。

(b)数据标准化处理。第一,对初始数据进行标准化处理。设评价指标j的理想值为,对于正向指标,越大越好,记为max;对于逆向指标,越小越好,记为。定义xij对于的接近度,则:

对于正向指标:

对于负向指标:

第二,定义标准化矩阵。利用直线型无量纲化比重法进行处理,得到第j项指标下第i个数据占该指标的比重yij,则标准化矩阵(71)

Y={yij}m×n,其中,0≤yij≤1。

(c)计算评价指标的熵值。具体公式为:

熵值ej=-kyijln yij,令k=1/lnm,则yij,0≤ej≤1 0≤ej≤1。

(d)计算评价指标的差异性系数。公式为:gj=1-ej

(e)定义评价指标的权重。权重Wj=gj/gj

(f)计算样本综合得分。根据熵的可加性,用第j项指标的权重Wj的乘积作为xij的评价值fij,即,则:

,fi为第i个样本的综合得分。(72)

(g)为避免ln0的出现,原始数据为0的指标,标准后值用0.00001代替。

根据评价指标体系,通过文献研究和专家咨询,为克服多指标变量间信息的重叠和确定权重的主观性,研究中对高校技术创新溢出能力实证评价运用了客观赋权法——熵值法。

(5)地图可视化分析方法

地图分析方法是地理学重要的方法,通过地图可以直观地展现知识创新活动的空间分布、地区差异和时空变化。本研究根据需要绘制了专题地图,主要运用ArcGIS软件、CorelDRAW软件和MapInfo软件制作和表达了相关数据的时间、空间分异属性。

1.3.2 研究对象和主要数据来源

(1)研究对象

本研究选取国家“211工程”建设的重点高校共116所,作为研究对象。选取的考虑因素是:

第一,从国家创新体系来看,“211工程”高校具有重要的地位。“211工程”是新中国成立以来由国家立项在高等教育领域进行的规模最大、层次最高的重点建设工作,是国家实施“科教兴国”战略的重大举措,是中华民族面对世纪之交的中国国内外形势而作出的发展高等教育的重大决策,而“985工程”高校均在“211工程”之列,“211工程”高校均进入了国家2017年实施的“双一流”建设行列。国家“211工程”高校,带动了我国高等教育整体水平的提升,为经济社会持续、健康发展作出了重要贡献。可以说,“211工程”高校已经成为中国技术创新体系重要的知识生产者和技术传播者,考察其在技术创新溢出中的时空分异规律和作用,对于揭示国家创新体系、区域创新体系的发展过程和运行机理,具有重要意义。

第二,从全国高校发展来看,“211工程”高校具有较强的代表性。根据教育部公布的《2016年高等学校科技统计资料汇编》(73),2015年国家“211工程”高校共在国外学术刊物发表论文203238篇,占全国高校302414篇的67.2%,共获国家科技成果奖励(三大奖)228项,占全国高校296项的77.0%,申请国家发明专利62400项,占全国高校109445项的57.0%,共获专利技术转移转让收入53145.9万元,占全国高校66933.9万元的79.4%。因此,以国家“211工程”高校作为研究对象,分析其技术创新溢出的时空分异规律和机理,具有较强的代表性和示范性,对进一步推进高校在国家创新驱动发展战略中发挥更大作用具有较高的参考价值。

第三,从地域分布来看,国家“211工程”高校的分布具有普遍性。其分布在全国除港澳台地区以外的31个省份,能够反映出区位差异、经济发展水平、科技发达程度、交通便利程度等不同地区技术创新溢出的差异。

各省份“211工程”高校具体分布情况如下(74)

北京26所:清华大学、北京大学、中国人民大学、北京工业大学、北京理工大学、北京航空航天大学、北京化工大学、北京邮电大学、对外经济贸易大学、中国传媒大学、中央民族大学、中国矿业大学(北京)、中央财经大学、中国政法大学、中国石油大学(北京)、中央音乐学院、北京体育大学、北京外国语大学、北京交通大学、北京科技大学、北京林业大学、中国农业大学、北京中医药大学、华北电力大学(北京)、北京师范大学、中国地质大学(北京)。

江苏11所:南京大学、东南大学、苏州大学、河海大学、中国药科大学、中国矿业大学(徐州)、南京师范大学、南京理工大学、南京航空航天大学、江南大学、南京农业大学。

上海10所:复旦大学、华东师范大学、上海外国语大学、上海大学、同济大学、华东理工大学、东华大学、上海财经大学、上海交通大学、第二军医大学。

陕西8所:西北大学、西安交通大学、西北工业大学、陕西师范大学、西北农林科技大学、西安电子科技大学、长安大学、第四军医大学。

湖北7所:武汉大学、华中科技大学、中国地质大学(武汉)、华中师范大学、华中农业大学、中南财经政法大学、武汉理工大学。

四川5所:四川大学、西南交通大学、电子科技大学、西南财经大学、四川农业大学。

天津4所:南开大学、天津大学、天津医科大学、河北工业大学。

辽宁4所:大连理工大学、东北大学、辽宁大学、大连海事大学。

黑龙江4所:东北农业大学、东北林业大学、哈尔滨工业大学、哈尔滨工程大学。

湖南4所:湖南大学、中南大学、湖南师范大学、国防科学技术大学。

广东4所:中山大学、暨南大学、华南理工大学、华南师范大学。

吉林3所:吉林大学、东北师范大学、延边大学。

安徽3所:安徽大学、合肥工业大学、中国科学技术大学。

山东3所:山东大学、中国海洋大学、中国石油大学(华东)。

重庆2所:重庆大学、西南大学。

福建2所:厦门大学、福州大学。

新疆2所:新疆大学、石河子大学。

河北1所:华北电力大学(保定)。

山西1所:太原理工大学。

内蒙古1所:内蒙古大学。

浙江1所:浙江大学。

江西1所:南昌大学。

河南1所:郑州大学。

广西1所:广西大学。

云南1所:云南大学。

贵州1所:贵州大学。

甘肃1所:兰州大学。

海南1所:海南大学。

宁夏1所:宁夏大学。

青海1所:青海大学。

西藏1所:西藏大学。

(2)主要数据来源

研究对象中涉及的原始数据,来源于国家知识产权局专利检索网站(http://www.Pss-system.gov.cn/)数据库。数据采集和筛选的原则和步骤如下:

①考虑专利申请、授权等的周期性特点,所采集专利数据周期为2000年至2015年,即“申请日”为2000—2015的自然年度。

②根据国家《专利法》(75),发明专利具备新颖性、创造性和实用性,审查也更加严格,更能体现一所学校技术创新的真实水平。因此,研究中的专利信息专指发明专利信息。

③国家《专利法》规定,“发明专利申请后,经初步审查认为符合本法要求的,自申请日起满十八个月,即行公布”。研究始于2016年1月,以116所国家“211工程”大学的准确名称作为检索项,按“申请日”先后顺序将有关专利信息数据下载到本地电脑,建立原始信息数据库,共有“原始信息”533674条。二次校核时间为2017年7月。

④对原始数据进行人工二次筛选,剔除系统无法自动识别的部分,将“申请人”中包含的全国116所“211工程”高校准确名称之一的专利数据信息,记为1项,并确定为专利“有效信息”,共408603条。涉及高校更名、高校合并情况的专利,计入当前高校。如果“申请人”中包含“211工程”高校数多于1个,则按排名在前的高校不重复统计。

⑤对专利“有效信息”进行三次人工筛选,按“申请日”自然年度,将专利信息按申请专利情况、转移专利情况、授权专利情况、有效专利情况和专利被引用情况等进行分类,形成“分类信息”,具体见附录。

⑥对照研究设计的“高校技术创新溢出能力评价指标体系”,将分类信息进行四次人工筛选。如果“申请人”中既包含国家“211工程”高校,又包含某企业,则认为该高校与某企业之间存在技术创新合作溢出关系,多个企业的,按排名在前的企业不重复统计。如果“申请人”中含国家“211工程”高校的专利被转移(包括专利实施许可、专利权转让、申请权转让)到某企业,则认为该高校与某企业之间存在技术创新转移溢出关系。据此,形成了适用于熵值法分析的“评价信息”,其中合作申请专利信息32867条,专利技术转移信息14543条。

⑦研究中也收集了港澳台地区高校在国家知识产权局申请的专利数据信息。但因这些高校未列入国家“211工程”建设,研究中未列入评价,将另进行相关研究。

另外,相关性回归分析数据主要来源于《中国科技统计年鉴》、国家统计局公布的“国民经济和社会发展统计公报”和教育部每年公布的“高等学校科技统计资料汇编”。交通距离利用GPS卫星地图在线查询获得。

1.3.3 研究内容与技术路线

研究内容与技术路线如图1-1所示。

图1-1 研究内容与技术路线图

本书按照“提出问题”“分析问题”“解决问题”的总体思路,内容共分为8章。

第1章为绪论。介绍研究背景、研究意义、相关概念,提出研究所关注的科学问题。

第2章为理论基础和文献综述。介绍研究所依据的主要理论,分析有关领域的研究现状,寻找研究的创新和价值所在。

第3章通过主成分分析法、数据包络分析(DEA)法,概述了高校科技创新的发展状况。

第4章通过熵值法、专利计量分析法、地图可视化分析法,研究了高校技术创新溢出的空间格局演变。

第5章通过社会网络分析法、回归分析法,研究了高校技术创新溢出的社会网络发展状况,及其与技术创新溢出能力的作用关系。

第6章通过文本分析法、典型案例分析法,研究了高校技术创新溢出的模式与机制。

第7章借助于回归分析法,针对研究与实证分析的结果,提出了相应的策略建议。

第8章为研究结论与展望。

其中,第3、4、5、6章是本书的核心内容,回答了研究所关注的科学问题。