中国茶学文献计量研究报告
(中国农业科学院茶叶研究所,浙江杭州310008)
摘要:从各大期刊网、图书馆、个人收藏资料等来源中搜集与茶有关的文献资料,利用access数据库技术开发出一个中文茶学文献资料检索数据库。利用该数据库对茶学文献进行的统计分析得到,最近10年共发表中文茶学文献21373篇,分布于2037种出版物中,参与创作的作者(指第一作者)有9493名,他们分属于6889个机构。近10年间茶学文献发表总量呈抛物线型增长趋势,但2001年首次出现下降。学术性文献的分布范围极广,而非学术类文献的分布则相对较集中,载文最多的14种期刊所发表的文献量超过文献总量的49%。
关键词:文献;计量;数据库;检索;茶学
astudyonthetealiteraturewithstatisticsmethod
zhuyong-xing
(tearesearchinstitute,chineseacademyofagriculturalsciences,hangzhou310008,china)
abstract:tealiteraturesweresearchedandcollectedfromtheresourcesofsomebigjournalwebsites,biglibraries,andthepersonallycollectedtealiteraturesetc.usingaccessdatabasetechniqueachinesetealiteraturedatabasewasdeveloped.withthisdatabasethechinesetealiteraturespublishedinthelast10yearswerestatisticallyanalyzed.theresultsshowedthatthereare21373tealiteraturespublishedinthelast10yearswhichdistributedin2037publishingmediasandconcernedwith9493authors(thefirstauthor)whobelongto6889institutions.thetotalamountsoftealiteratureshowedaparabolatypedevelopingtrendduringthelast10years,whereas,thepublishedtealiteraturein2001decreasedinthefirsttime.academictealiteratureisdistributedinavastrangeofjournal,whereastheothertealiteratureispublishedinacomparablenarrowrangeofjournal,morethan49%oftheseliteratureswerepublishedby14kindsofjournals.
keywords:literature;metrological;database;index;teascience
中国是茶的故乡;茶的利用价值早在3千多年前的"神农"时代就被发现;有关茶的专著,最早见于唐朝陆羽的"茶经"[1]。随着科学文明的日益昌盛,有关茶的知识已形成为一门专业学科-茶学,它所涉及的文献数量庞大、内容丰富、研究领域广泛。作为一门专业学科,对如此海量的茶学文献,进行全面、系统的搜集、整理和分析研究是摆在茶学界面前的一项迫切的任务。这是一个建设茶学知识体系的基础工程,对茶学科建设和推动科技进步都具有十分重要意义。
茶学文献数量巨大、分布极广,靠传统方法进行的文献资料搜集、整理,其结果往往是事倍功半,且难以搜集到较为全面的文献资料。据国家新闻出版总署统计,2001年全国出版的期刊多达8889种[2],要在如此多的期刊中搜集与茶有关的文献,没有现代化的技术与手段是不可想象的。近年来,随着信息技术及科技信息基础工程建设的高速发展,对茶学文献资料进行全方位的搜集、整理和分析研究的条件已经成熟。实践证明,采用数据库技术对专业文献进行搜集、整理、检索和利用是最为有效的途径和方法[3]。正是在这种背景下,我们开展了茶学文献资料的全面搜集和整理,并建成了一个迄今为止最大最全的茶学文献资料数据库,利用其中的部分数据,本文从文献计量分析的角度,对我国最近10年来茶学文献的整体状况做一个基本的分析。
1.材料与方法
以文献计量学原理为指导[4],以我国公开发行的期刊、部分内部发行刊物及部分其他类型的文献资料为原始材料,搜集整理其中与茶有关的文献资料,并对其进行一系列的统计分析和综合评价。
1.1文献源
文献搜索范围包括中国期刊网(付费用户)、中国学术期刊(光盘版)电子杂志社出版的中国学术期刊光盘版、万方数据公司的数字化期刊群(付费用户)、浙江大学图书馆馆藏期刊、浙江省情报研究所馆藏期刊、中国农业科学院茶叶研究所信息中心搜集的茶叶文献资料,一些著名网站中的茶学文安溪茶献资料,以及笔者多年搜集的文献资料。搜索文献资料的时间范围大部分是1993-2002年初,有少量文献资料的时间范围可早至1984年,但在一些与时段有关的统计分析中,统计样本的时段将被限定,超时段的记录被删去。确定搜索范围的原则主要是尽可能包含所有茶学文献。上述搜索范围所涉及的期刊种类超过7000种,搜集到的茶学文献数量在国内居首位,尤其是近几年文献的数量,估计可达到全部茶学文献的95%以上。
1.2数据搜集方法及预处理
在上述搜索范围内,分别采用互联网在线检索、计算机光盘检索、人工查找并输入等方式获得原始数据。对搜集所得的原始数据,建立其基本的access数据库[5]。对此基本数据库,通过对数据结构及字段属性等的设计、数据转换、并结合人工检查纠错等手段,使输入数据的格式、项目、属性等完全统一,然后把来自不同文献源或同一文献源的重复文献排除掉,从而尽可能保证数据库中每条记录的唯一性。为保证最后样本数据的准确性,我们还采用抽样人工核对的方法进行检查和校正。为便于计量分析,从基本数据库演化出一系列辅助字段和辅助数据表,最后把合格的数据分离出来另建数据库,作为本文统计分析的基础样本。在上述处理的基础上,根据不同分析目的,进行各种统计分析。
2.结果与分析
2.1收录文献的概况统计
对全部样本文献进行统计分析,得到基本统计结果如下:共搜集最近10年的中文茶学文献21373篇,分属于栽培、育种、加工、机械、生理生化、医学、食品、经济、茶史与茶文化、生态、信息等专业;其中学术性文献(具有关键词、摘要,或被一些重要文摘刊物收录的重要科技文献,主要包括学术论文、研究报告、文献综述等)10675,非学术性文献(主要指科普、文化与历史、一般性的技术指导、科技信息报道等文献)10698篇;它们分布于2037种期刊(其中包含少量专著等其他载体);其中茶专业刊物(检索条件为:刊名中带有茶字)共有50种;参与写作的作者(除非特别说明,均指第一作者,以下同)有9493位;他们分属于6889个机构。
2.2文献的年份分布
茶学科在最近10年内的发展较快,从我们所搜集的文献统计,每年收录的文献数量从1994年的1203篇,到2000年增至3144篇,平均年递增率17.35%。其中学术性文献丛1994年的264篇增至2000年的982篇,平均年递增24.48%。然而,2001年的茶学文献数量,无论是总数(2458篇)还是学术性文献数量(863篇),都呈下降趋势(表1)。
表1.茶学文献数量的年分布
table1.theannualdistributionoftealiteratures
年份year19941995199619971998199920002001
文献总数total12031329146021332087213231442458
学术文献academic264381476684888904982863
表2.最近3年期刊刊载茶学文献的频次分布
table2.thedistributingfrequencyoftealiteratureinjournalinthelatest3years
篇数范围range1-2021-4041-6061-8081-100>101总数total