一、个人简介
祁坤钰,男,1968年出生,教授,硕士研究生导师。藏文信息处理导师组组长,国家藏文信息标准化工作组成员。毕业于藏语言文学专业,从事专业为藏文信息处理。长期致力于藏文信息处理领域语料库建设、标注规范、词法句法分析、知识库构建及语义标注等基础研究和信息检索、文档校对、文本聚类及互联网等研究工作。2001年获得国家科技进步二等奖(排名第二)。主持国家自然基金《基于依存关系的藏文语义角色标注研究》[61363057]一项和甘肃省科技计划创新群体项目《藏文智能信息处理》一项,参与了2项国家863项目、1项国家科技支撑项目、1项国家社科基金项目。完成了《藏汉英电子词典》等多项省部级科研项目。出版专著《藏文分词研究》1部,发表论文20余篇。承担语言信息处理方向《计算语言学》、《语料库语言学》、《藏语语法》、《认知语言学》等研究生专业课程的教学任务。
二、教学课程
本科生课程:1)藏语语法;2)计算机基础;3)电子政务原理;4)藏文信息处理。
研究生课程:1)计算语言学;2)统计语言学;3)语料库语言学;4)语言学方法论;
指导学生方向:1)藏文自动分词与标注;2)藏语词汇知识库;3)藏语句法分析;4)藏语语法信息词典;5)语料库建设及语言模型。
硕士研究生每年招收三名,方向为藏文信息处理。欢迎懂藏语、具有语言学和理工科背景的学生报考。
三、指导研究生情况
截止2020年6月,指导藏文信息处理方向硕士研究生44人。
四、研究领域
藏语语言研究:1)藏语词汇研究;2)藏语语法研究;
藏语语言知识库:1)藏语语法信息词典;2)术语数据库;3)藏语词汇框架语义树库;
藏语语料库研究:1)语料库加工研究;2)语料库标注及规范研究;3)基于语料库的语言分析;4)平行语料库对齐技术。
藏语计算语言学:1)藏文自动分词与标注;2)藏文自动校对与拼写检查;3)藏文句法分析;4)藏语框架语义学;5)藏语语言模型与机器学习技术。
五、科研成果
(一)科研项目
1.国家自然科学基金:
基于依存关系的藏文语义角色标注研究 [地区基金 61363057] 43万 项目执行时间:2014.1-2017.12项目承担单位:西北民族大学 项目组成员:祁坤钰,桑吉苏奴,华毛,马拉毛草,丹增诺布,官却吉
2.甘肃省基础研究创新群体项目:
藏文智能信息处理:项目执行时间:2017.1-2019.12 项目承担单位:西北民族大学 项目组成员:祁坤钰、戴玉刚、达哇彭措、加羊吉等,经费50万。
3.甘肃省自然基金项目.藏文Web的舆情监控系统(1107RJZA157).经费3万时间2011.1– 2012.12.排名3/3
4.国家语委“十二五”科研2011年度一般项目.基于网络的藏语言生活状况调查研究 (YB125-2).2011.1- 2013.12.
5.甘肃省社科基金 现代藏语语法信息词典设计研究 2007年 经费6000元
祁坤钰 马进武多拉 达娃彭措 多杰卓玛
6.国家教育部重点项目(教育部民族文字规范化标准建设及信息化科研项目),统一平台上少数民族文字识别系统研发(MZ115-005)
子课题 《印刷体藏文识别系统文本后处理研究》清华合作项目 经费3万 2006.1-2006.12 ,主持,祁坤钰、王维兰、曹晖、多杰卓玛
7.藏文智能输入研究 国家自然科学基金面上项目 [60273090] 2003.1-2004.12 16万
8.基于神经网络的残缺唐卡图像修复技术研究 国家民委基金项目 2003.1-2004.12 2.2万 3-4
9.基于网络媒体的藏文信息处理技术及其规范研究 国家863项目 2003AA115530 30万 2003.12-2005.12 5-10
10.民族语言版本Linux和办公套件研发 国家863项目2003AA13500 85万 2003.12-2005.12 5-9
11.藏汉英电子词典 国家民委 教司字[ 2000 ] 18号 2000.6-2004.12 自筹 主持人 祁坤钰 于洪志 王维兰 戴玉刚 曹晖 多拉 达娃彭措 多杰卓玛
12.信息处理用藏文分词研究 国家社会科学基金面上项目 [02BYY038] 2002.7-2005.6 8万,2-6
(二)代表学术论文
1.基于依存句法的藏文属格结构统计研究. 《西北民大学报》自然版.2016年第2期.
2.藏文格与英语介词功能对比研究.《语言文字学》2016年3月. 丁海兰.祁坤钰
第37卷.2016.6 丁海兰.祁坤钰
3.藏文音节七元组类型分析研究.《西北民大学报》自然版.2015年第1期.第36卷.2015.3 仁青卓么.祁坤钰.贡保扎西.
4.基于Word VBA的藏文排版规范及技术实现.《西北民大学报》自然版.2015年第4期.第36卷.2015.12 丁海兰.祁坤钰
5.基于依存关系的藏文语义角色标注研究.西北民族大学学报(哲学社会科学版)2014年01期 .祁坤钰 .
6.基于词汇语料的白马藏语语音分析研究.西藏大学学报(哲学社会科学版)》CN-54-1034/C.2014.2 .祁坤钰,杨士宏
7.藏语动词语法属性计量研究.《西北民大学报》自然版.2014年第2期.2014.6.仁青卓么、祁坤钰
8.面向信息处理的藏语语义角色研究.《西北民大学报》自然版.2014年第3期.2014.11.祁坤钰
9.基于语料库的藏语名词分类与统计研究.西北民大学报》自然版 2012年 第3期 2012.11 祁坤钰.
10.基于语料库的藏语形容词统计研究.西北民族大学学报(哲学社会科学版)2012年06期 马拉毛草、祁坤钰.
11.祁坤钰.基于语料库的藏语名词分类与统计研究[J]. 《西北民大学报》自然版. 第3期,Vol33,No3.ISSN1009-2102. 2012.11
12. 马拉毛草,祁坤钰. 基于语料库的藏语形容词统计研究[J]. 《西北民大学报》哲社版. 第6期,总第184期.ISSN1001-5140. 2012.6
13.祁坤钰. 基于国际标准编码系统的藏语分词词典机制研究[J]. 《西北民大学报》自然版. 第4期,Vol31,No4.ISSN1009-2102. 2010.11
14.苏俊峰,祁坤钰,本太. 基于HMM模型的藏文词性标注研究[J].《西北民大学报》自然版. 第1期,Vol30,No 1. ISSN1009-2102. 2009.3
15. 张晨,祁坤钰. 基于互信息的词语搭配研究方法[J]. 《西北民大学报》自然版. 第3期,Vol30,No 3.ISSN1009-2102. 2009.20
16.达召卡什吉,祁坤钰,刘文香. 现代藏语语料库的设计与规划[J]. 《安多研究》. 第1期,ISBN978-7-105-10094-1.2009.6
17.祁坤钰. 基于国际标准编码系统的藏文拉丁转写规则模型[J]. 《西北民大学报》自然版. 第3期,Vol29,No 3.ISSN1009-2102. 2008.10
18.祁坤钰. 信息处理用藏文自动分词研究[J]. 《西北民大学报》哲社版. 第2期.ISSN1001-5140. 2006.4
19.陈丽娜,祁坤钰,贾彦民,吴健,康丽.藏文拉丁转写的研究与实现.《计算机工程与设计》.第1期.ISSN 1000-7024.2006.4
20.祁坤钰.现代藏语语义词典的概要及设计[J]. 《西北民大学报》自然版. 第1期,Vol27,No 1.ISSN1009-2102. 2004.6
21.祁坤钰.藏文古迹电子化与UNICODE技术[J]. 《西北民大学报》自然版. 第1期,Vol26,No 2. ISSN1009-2102. 2003.6
22.祁坤钰.基于规则的藏文识别后处理研究[J]. 《西北民大学报》自然版. 第4期,Vol27,No 4. ISSN1009-2102. 2002.10
23.王维兰,祁坤钰,丁晓青.藏文识别中相似字丁的区分研究.《中文信息学报》.第四期.ISSN 1003-0077 2002-4
24.祁坤钰.藏文拼写输入法.《国际中文电脑会议论文集》. ICCC2001 新加坡 ISSBN
(三)著作
1.藏文分词与标注研究.甘肃民族出版社. ISBN 978-7-5421-2839-3. 2015年4月.
2.《初中、高中藏语文教材用词调查报告》录入中国生活语言绿皮书.商务印书馆出版.2009年。
3.藏文词汇计量统计研究.人民出版社. ISBN: 9787010121758, 2013-11
(四)获奖情况
1.藏文视窗平台、字处理软件和藏文网站.甘肃省奖励办.甘肃省科技进步一等奖. 2-10. 1999.10
2.藏文视窗平台、字处理软件和藏文网站.国务院.国家科技进步二等奖.2-10 . 2001.12
3.藏、汉、英多功能组合软件. 甘肃省教育厅.甘肃省教育厅二等奖.2-5. 2002.10
4.多字体印刷藏文(混排汉英)文档识别系统.北京市.科技进步二等奖. 2004.10
5.《藏文智能输入系统》.甘肃省高校科技进步奖二等奖.省级教育厅.2-6. 2008.7