您所在位置: 网站首页 / 文档列表 / 语言学 / 文档详情
计算语言学讲义第九讲句法分析(三).pdf 立即下载
上传人:yy****24 上传时间:2024-09-04 格式:PDF 页数:72 大小:391KB 金币:18 举报 版权申诉
预览加载中,请您耐心等待几秒...

计算语言学讲义第九讲句法分析(三).pdf

计算语言学讲义第九讲句法分析(三).pdf

预览

免费试读已结束,剩余 62 页请下载文档后查看

18 金币

下载文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

计算语言学第9讲句法分析(三)刘群中国科学院计算技术研究所liuqun@ict.ac.cn中国科学院研究生院2011年春季课程讲义内容提要计算语言学讲义(09)句法分析(三)2依存分析•依存结构和依存语法•短语结构树转依存树•专门的依存分析模型–概率依存模型–最大生成树模型–状态转移模型计算语言学讲义(09)句法分析(三)3依存分析简介•依存分析与短语结构分析类似,但有所不同:依存分析丢掉了跨度信息和跨度上的句法标识IP是XNPVP√PU。PNVCNP我学生。我是QPNPCDCLPNN一个一M学生个计算语言学讲义(09)句法分析(三)4依存分析简介•大多数语言,包括汉语和英语,满足投射性。所谓投射性是指:如果词p依存于词q,那么p和q之间的任意词r就不能依存到p和q所构成的跨度之外Xp…r…q…s计算语言学讲义(09)句法分析(三)5短语结构树转依存树•任何短语结构树句法分析模型输出的句法树,通过YamadaandMatsumoto(2003)的中心词映射规则即可转化为依存结构树IP是NPVPPU。PNVCNP我学生。我是QPNPCDCLPNN一个一M学生个计算语言学讲义(09)句法分析(三)6短语结构树转依存树•中心词映射规则示例–规则:IPright{IPVP}–意义:对于句法树中标识为IP的节点,自右向左扫描该节点的所有孩子,第一个出现在列表{IPVP}中的孩子即为中心孩子节点。其他孩子节点的中心词将依存到中心孩子节点的中心词•对于给定的短语结构树,自底向上应用中心词映射规则,即可确定各词之间的依存关系计算语言学讲义(09)句法分析(三)7依存分析模型•生成式依存模型–词汇依存概率模型(Collins模型)–依存生成概率模型(Eisner模型)•判别式依存模型–状态转移模型–最大生成树模型计算语言学讲义(09)句法分析(三)8词汇依存概率模型•Collins,1996•训练:通过极大似然估计,在树库中统计出任意两个词之间存在特定依存关系的概率•解码:寻找使得所有依存词对的依存概率的乘积最大的依存树,采用自底向上分析法计算语言学讲义(09)句法分析(三)9依存分析模型•生成式依存模型–词汇依存概率模型(Collins模型)–依存生成概率模型(Eisner模型)•判别式依存模型–状态转移模型–最大生成树模型计算语言学讲义(09)句法分析(三)10概率依存模型(Eisner,1996)给定输入语句(含词性标记)的一棵可能的依存树,设该树中任一节点P,它的左孩子由近及远分别为LC1,LC2,…,LCm;右孩子分别为RC1,RC2,…,RCnP</s>LCmLC2LC1<s>RC1RC2RCn</s>定义P生成其所有孩子的概率为:m=Gen()P∏Pr(LCwordi.|LCi−1.POSPword,.)i=1n×∏Pr(RCi.word|RCi−1.POS,P.word)i=1计算语言学讲义(09)句法分析(三)11概率依存模型(Eisner,1996)•对于每棵候选依存树T,整棵树的生成概率定义为树中所有节点生成概率的乘积Gen(T)=∏Gen(x)x∈T•解码的任务就是寻找生成概率最大的依存树计算语言学讲义(09)句法分析(三)12依存分析模型•生成式依存模型–词汇依存概率模型(Collins模型)–依存生成概率模型(Eisner模型)•判别式依存模型–状态转移模型–最大生成树模型计算语言学讲义(09)句法分析(三)13最大生成树模型•McDonaldetal.,2005•McDonaldandPereira,2006•给定一个包含N个词的句子,任意两个词之间都可能存在依存关系,共有N*(N-1)种可能的依存边(不能含有依存到自己的自环),只是依存强弱不同•将依存强弱表示为这个完全图中边的分数。于是,寻找最可能的依存树的任务就转化为寻找这个完全图的最大生成树计算语言学讲义(09)句法分析(三)14最大生成树模型•每条边pc的分数定义为score(p→c)=f(p→c)⋅w•f()函数返回依存边pc的特征向量;w为权重向量,它由判别式训练得到计算语言学讲义(09)句法分析(三)15最大生成树模型-特征设计•特征设计针对边进行,而非节点•任意一条pc的特征可以取那些呢?计算语言学讲义(09)句法分析(三)16最大
单篇购买
VIP会员(1亿+VIP文档免费下)

扫码即表示接受《下载须知》

计算语言学讲义第九讲句法分析(三)

文档大小:391KB

限时特价:扫码查看

• 请登录后再进行扫码购买
• 使用微信/支付宝扫码注册及付费下载,详阅 用户协议 隐私政策
• 如已在其他页面进行付款,请刷新当前页面重试
• 付费购买成功后,此文档可永久免费下载
年会员
99.0
¥199.0

6亿VIP文档任选,共次下载特权。

已优惠

微信/支付宝扫码完成支付,可开具发票

VIP尽享专属权益

VIP文档免费下载

赠送VIP文档免费下载次数

阅读免打扰

去除文档详情页间广告

专属身份标识

尊贵的VIP专属身份标识

高级客服

一对一高级客服服务

多端互通

电脑端/手机端权益通用

手机号注册 用户名注册
我已阅读并接受《用户协议》《隐私政策》
已有账号?立即登录
我已阅读并接受《用户协议》《隐私政策》
已有账号?立即登录
登录
手机号登录 微信扫码登录
微信扫一扫登录 账号密码登录

首次登录需关注“豆柴文库”公众号

新用户注册
VIP会员(1亿+VIP文档免费下)
年会员
99.0
¥199.0

6亿VIP文档任选,共次下载特权。

已优惠

微信/支付宝扫码完成支付,可开具发票

VIP尽享专属权益

VIP文档免费下载

赠送VIP文档免费下载次数

阅读免打扰

去除文档详情页间广告

专属身份标识

尊贵的VIP专属身份标识

高级客服

一对一高级客服服务

多端互通

电脑端/手机端权益通用