古典语言

“日知古典”版《论老年》第77节(页100) est enim animus caelestis ex altissimo domicilio depressus et quasi demersus in terram中terram误作terrain(据洛布版)。【注】责编马晓玲为东北师大古典所历史学硕士。 2016-01-14
上一篇     下一篇 共18篇  

【研究向】用数学方法解析外语习得 2014年02月25日 19:30:30

[图片不能显示的问题已修正] 产生这个想法是前几个星期突发灵感:是不是任何一个什么简单的东西,只要一加上数学,各种高大上的数学公式一插,就会瞬间理解不能,从而提升自己的逼~格~捏?


在 最近的学习中,本钙发现越来越多看似完全随机的自然现象竟然能用巧妙而精美的数学公式来建模,比如气流漩涡、液体流速、海岸分形、温度(热辐射)分布,连 电磁学、光学、概率学,深入进去后才发现原来电磁场可以化为向量场,从而类比于数学上的向量空间,然后利用旋度、闭合积分、线性微分等来进行深层研究;就 连平时觉得无比简单、直观的概率学,到了量子层面也居然需要用线性代数、密度矩阵来求解,突然感觉自己20年啥都没真的学会!大自然实在是最高端的工程 师!简直叹为观止!


既然连这些东西都可以建模,于是想:语言习得是否也可以建模?【如果大范围的实验对象都表现出相似的行为/结果,那么其中必然有一个普遍性规律】。


本钙就用这个思路,来探讨一下【语言学习】的主题,解决一个语言学习类的日经问题。本钙目前基本流利使用英日法,已初见成效的有西、德,还剩下意葡俄阿正在操练中,但因为时间不够加上专业课程本身也紧张(法国高校的contrôle continu和TD逼得好TM紧),因此没时间操练。不过经验还是有的。【阿拉,话说本管理就是前年夏天发过几期用英法德西意等语言,多语对照翻译拉丁语名句的,可能大家早忘了~~~】好啦,废话少说,现在开始…

——————————1,2,3,Mark! ———————————


对于语言学习,尤其是第二外语习得(second language acquisition, 通称L2 Acquisition),有一个日经问题频繁出现:“学习一门外语要多久?”或“多长时间能学会一门新语言?”


上网用关键词“语言学习”“时间”联合搜索,出来的结果没有太大的统一性:有的人说要花十几年,有的说只要你努力,几个月就够了。而且经常还能搜出些诸如“如何3个月掌握一门外语” “看我1年时间学会5门外语” 等等的帖子。实际情况究竟怎么样呢?


语 言能力很难被量化。但我们可以通过大数据分析,利用线性回归,修正误差,逼近某些特定的【特征】,构建能模拟语言习得与所需时间的函数关系。(但由于在google上未能搜索到研究L2习得的平均用时的调查或统计研究,给建模带来了一定的困难,这里本钙只能从自身以及另外接触到的国内外的某些语言爱好者们的亲身经历上,来作经验性的判断了。)


现,我们来粗略地量化一下,“学习一门外语要多久”或“多长 时间能学会一门新语言”的问题。为了方便后面的结论导出,本钙首先从“学习一门语言平均要多久”开始(即研究当语言学习是自变量,所需时间是因变量的情况)。国外有一条关于L2习得的法则:Language learning in terms of hours – Apply the “10,000-hour rule”,原文截取:


If, for the sake of argument, we consider fluency to be the same as being an “expert” in speaking a language, then a learner may well invest 10,000 hours in their language studies to attain fluency.


换言之:假使我们认为【掌握一门语言】的标准是【能流利使用该语言】,那么要达到流利程度,我们需要花费一万小时的学习。考虑到不同的语言学习方式,经过 粗略计算我们可以得到如下模拟结果:
#1:成人学校。每周一次,一次3小时的成人学校,不间断地坚持,你需要约69,4年达到流利水平。
#2:学校的外语课。按照本钙的中学教育模式,每节英语课50分钟,不算早自习,大约每周7节课吧,一年9个月在校,那么需要47.6年达到流利水平。
#3:自学。每天1小时,一年365天,不间断地学,约需27.4年。
#4:浸入(指的是进入操该语言的国家,生活在该语言环境中)。假设每天有12个小时都浸泡在该语言中,大约2.2831年i就可达到流利(这里精确到4位因为后面有用)。
【注:由于本钙的函数模型是连续,处处可导的,因此以上模拟需要具备一个明显的前提:不间断地学。】


这 就是【一万小时法则】带来的量化模拟结果,大家可以对号入座。该法则据说不仅适用于语言,据作者Malcom Gladwell:true expertise is achieved after an individual has invested 10,000 hours in learning or practicing a skill. This may be a sport, a musical instrument or the study of something.


当然,你不可能无穷尽地投入,也不可能无穷尽地产出。任何做功都有极限。如果我们考虑如下满足两个条件的模型:#1:增长 率100%#2:不间断,也就是说,在给定的时间里,如果开始时我只会说1门语言,结束时我能说正好2门(即增长率100%),且学习过程不间断,平均 学习速率恒定,设时间为t,那么我们刚好有:
★ 当t→+∞时, lim(1+1/t)^t → e
也即满足自然增长极限的理论:在一 定的时间里,你每年学习一点,每月学一点,每天学一点,每分钟学一点... 无时无刻都多学一点儿,不间断地学,你最终也只能完全掌握e≈2,71828门语言。这是由人本身的精力所限制的。那么,在回答“学一门新语言的平均用 时”时,本钙首先考虑进这个自然增长极限e。


然后,在(貌似是)生物化学领域(细胞增殖研究还是啥来着),有个Lange和 Wiehagen在1991年发表的“模式语言学习”报告,简略说来是:若A={0,1,...},为任一不为空集的含有至少两个元素的有限字母表,令 X={x(i)|i∈N}为一含有无限变量的集合,使得A∩X=∅。而“模式π“则是任一A∪X的非空子集串。定义L(π):由模式π所产生的语言,是可 以由替换任一A*的非零子集串中的模式π的变量x而得到的子集串。那么对于任一含有k个变量的π模式,通过研究发现在”最好的情形下“,其总习得时间为 T[log|A| (|A|+k)π^2]。


因此本钙也参考该模型,在考虑了常量e以后,考虑进第二个数学常量 π≈3.1415(不是上段中的那个模式π),且对其平方,用π^2来作x的倍增因子;使用对数函数模型(因为log函数微商>0,二次导数<0,满足了 学习某技能一开始很难,熟练后变得很快的普遍模式)。那么本钙的”新学一门语言达到流利水平平均需要花费的时间“的函数模型就形如:
★ y = ln(x*π^2),y=用时,x=所学语言的数目。其图像为【图一】:




利 用该模型,当x=1时,其用时y≈2.2895,与用一万小时法则所估计出来的2.2831年误差不足0.01年!因此本钙认为,该模型是成功的。但是我 们也可以看到,当y=0时,x并不为0. 这在纯数学意义上无害,但在该实际模型上却是不逻辑的:当x→0时,lim ln(x*π^2) → -∞。显然时间不可为负值。因此本钙接下来对该公式进行理论修正:


当ln(x*π^2)=0时,x0=?这是大学数学基础之一,应该难不倒大家:两边同时取e的指数后,得到xπ^2=1,因此x0=1/π^2 ≈ 0.1013. 因此修正后的公式为:ln[(x+1/π^2)*π^2],化简后得到:
★ln(xπ^2 +1)。此时其图像完美地从(0,0)起步【图二】:



修正公式计算出的x=1时的y的值是约2.38597年,与一万小时法则估算的2.28年有一定出入,不过在可容忍的误差范围内。另:
x=2, y≈ 3.0320;
x=3, y≈ 3.4213...
但 该模型的估算精确度应该也就到此为止,因为该函数的微商随x的增大急剧减小。不过考虑到之前说过的增长极限的事情,我们大致可以认为该模型的预测直到 x=e时都是基本精确的,因此有x*=e时,y* ≈3.3261. 即,(直观地从其反函数y=(e^x -1)/π^2看出)在完美的条件下,最有能力的人每时每刻不间断地学习,在3.3年左右的时间内,最多也只能流利说出两门新语言。而先前也说过,这是完美情况,事实上人不可能每秒都搞学习从不休息地学3年,他早就过劳死了。故该模型在x=1门语言时,有指导性意义;在x<=3门时,有理 论性意义。往后都是很不精确的。


由此,另一个反方向的问题:”在一定时间内能学会几门语言“(通常问句都是”一年内能学会
X 语吗)的问题,看似跟上面的“新学一门语言要花费多久”是逆函数关系,其实仔细考虑一下,考察时间对语言数量的映射,实则是对跨越语言障碍的【难度】的量 化。根据多位语言大亨和本钙自己、以及亲身接触到的几位多语使用者的经历,考虑进几大妨碍/有利于语言习得的因素,对于新语言【简单度】的量化大约可以表 示为如下函数关系:
★(狭义:)S=Ψ(-γA, λR, Q, P)
其中,Ψ表示映射关系,S表示Simplicity,简单度。A表 示Age,年龄,附带负的系数-γ,即dS/dA <0. R表示Retention记忆力,附带非负的系数λ,即dS/dR >=0. Q表示Quantum,已掌握的语言数目;P表示Practice,训练/实践,也可表示投入的时间。由于年龄和记忆力都是相当个人的因素,因此广义的新 语言习得的简单度的量化函数关系为:
★(广义:)S=Ψ(Q, P). 其一般形式可以写作:
★(经验性:)S=(Q^α) * (P^β), 其中α>0, β>0. 特别地,为了满足某些数学性质,我们再人为规定α=1-β ,即S=(Q^α)*P^(1-α),0<α<1 的话,其图像大致为【图三】:


该 函数图像是个曲面,图中颜色越蓝表示函数值越小,越红表示

...
注册或登录后查看完整内容

阅读(1233)| 评论(13)

  1. 鐘師☭ 2014年02月25日 20:42:59 举报
    大数据时代嘛,用的主要还是数学的统计思维。连抽象的社会问题都可以量化了
  2. 王茜Cecilia 2014年02月25日 21:57:49 举报
    主页君图片没法看啊
  3. 陌筱莫RickyRich 2014年02月26日 01:38:59 举报
    回复王茜Cecilia: 啊! 竟然看不到?那本钙重新传一传!
  4. 古典语言 2014年02月26日 01:55:34 举报
    回复王茜Cecilia:好啦,图片已经重新上传了,这回应该没问题了哈~~~
  5. 卧龙先生 2014年02月26日 02:15:13 举报
    楼主你这模型不符合实际啊,你说人类最多掌握e种语言(我数学渣暂且这么理解),可穆里尼奥为嘛会六种
  6. 古典语言 2014年02月26日 05:34:37 举报
    回复卧龙先生:是说“在给定的时间里”,这是一个极限,是当t→+∞时,lim(1+1/t)^t的极限,这个跟利息的增殖相同,但它是有时间条件限制的,是狭义的。这一条是针对“精力有限”“收获与付出成正比”等关系来的,它适用于否定“三个月学好一门外语”等广告。它只是个引子,用来推出后面的【语言-耗时】模型,告诉我们:就算连续不断地学,3年半左右也最多只能流利说两门。你说的穆里尼奥,他又不是在两年时间或更夸张地,又不是在三个月时间内学会的六种,他搞不好是花了5、6年的。而且他自己说“学会”,你不知道到底是什么水平;而这些模型所讲的“流利”,是指母语水平
  7. 卧龙先生 2014年02月26日 10:21:43 举报
    回复古典语言: 你这个意思我明白,但是t趋向正无穷到底是啥意思?另外穆里尼奥是母语级别的掌握无误,要不然他也不能带领多个国家的球队了。不过考虑到英葡西意法所具有的一定相似性,或许有可能修正到接近模型范围的地步。
  8. 古典语言 2014年02月27日 03:28:10 举报
    回复卧龙先生:噢,原来是这个地方没说明白。是这样的:比如我们考虑一个拥有100个完整细胞的培养皿,这种细菌每24小时完全分裂一次,若不考虑死亡与变异,明天你再来看的话应该有200个,其增量公式为2^t,即(1+100%)^t,t表示时间限制(24小时)。可是分裂不是瞬间的,并不是说过了刚刚好24小时,然后每个细菌都砰地一声复制出了一个新的。按照生物统计学,24小时过了一半,理论上也应该有一半的细菌完全复制了,那就分成了两阶段,增量即(1+50%)^2。倘若每过8小时就可以产生平均1/3的新细菌,新细菌立即具备独立分裂的能力,那就可以将1天分成3个阶段,24小时内细菌的总数会增至为(1+100%/3)^3...依次下去,我们可以将24小时分成(微分)无数个无限小的时间段,那么时间限制就由间断变为了连续,也即我们去求t→∞时,(1+1/t)^t的极限。所以这里的t→∞,并不是说时间长度无穷,而是指的时间分段!即不是说无穷多的时间里人只能学会2.7门语言,而是指在【一定的时间限度内】连续不断地学最多能流利2.7门。当然从语言-耗时模型的反函数(e^x -1)/π^2可以把这个“时间限制”确定为3.3年。也就是说最天才的人天天练习,大概可以期望在6年时间内学会5门语言,但什么“3个月学好一门外语”“一年学会8门外语”什么的就扯淡了
  9. 古典语言 2014年02月27日 03:44:25 举报
    回复卧龙先生:因此,再更清楚地补充一下就是:这些模型并不是在研究【人的一生中能学会多少语言】,而是在研究【在一定的时间限度内最多能学会多少门语言】或【学会一门新外语大概需要多少时间】。所以,我一生中当然可以学会10+门,但这并不是说我这10+门是在一两年时间内学会的。本文其实是在研究这个玩意儿。
  10. 卧龙先生 2014年02月27日 04:00:42 举报
    好吧,看到微分那俩字就大致搞明白了你的意思。果然对于一个数死早的人而言高数不靠谱啊[笑]
  11. 古典语言 2014年02月27日 06:21:45 举报
    回复卧龙先生:……是本钙没解释清楚……中间省了点儿步骤... 你知道的,数学嘛,经常是那种作者觉得这种东西稍微提一下大家应该都自己会推导,然后嗖~~~中间省略N步害羞
  12. 卧龙先生 2014年02月27日 23:18:48 举报
    没事这是很正常的事情,演绎法思维的体现之一。另外为啥你叫钙呢
  13. 古典语言 2014年02月28日 01:57:40 举报
    回复卧龙先生:恩,其实本来没想发展出一个理论出来的,本意是想娱乐一下看看是不是什么通俗易懂的东西一加上数学就变成了理解不能的那种……好像应验了呢防流感 关于那个自称的形式嘛,因为本文的发帖代号为【法兰西一线钙片明星】,这还是跟本主页的主页菌打趣的时候他给我起的,后来想想实在有趣,干脆就用上鸟~~~

玩转人人 公共主页 公众平台 客服帮助 隐私

商务合作 品牌营销 中小企业
自助广告
开放平台

公司信息 关于我们 人人公益 招聘

友情链接 经纬网 人人游戏 人人分期

人人移动客户端下载 iPhone/Android iPad客户端 其他人人产品