- 相關(guān)推薦
數(shù)學之美讀書筆記
數(shù)學中有個很有意思的東西,他的名字叫莫比烏斯環(huán),為什么說他很有意思呢?下面是小編精心收集的數(shù)學之美讀書筆記,希望能對你有所幫助。
數(shù)學之美讀書筆記【1】
最近看了這本《數(shù)學之美》,不得不感嘆一句,可惜早已身不在起點。
我讀書的時候,數(shù)學成績一直都很好,雖然離開學校已經(jīng)10多年,自覺當初的知識還是記得很多,6~7年前再考線性代數(shù)和概率論,還是得到了很高的分數(shù)。不過我也和大部分人一樣,覺得數(shù)學沒有太多用處,特別是高中和大學里面學的,那些三角函數(shù),向量,大數(shù)定律,解析幾何,除了在考試的題目里面用一下,平時又有什么地方可以用呢?
看了《數(shù)學之美》,驚嘆于數(shù)學的浩瀚和簡單,說它浩瀚,是因為它的分支涵蓋了科學的方方面面,是所有科學的理論基礎(chǔ),說它簡單,無論多復雜的問題,最后總結(jié)的數(shù)學公式都簡單到只有區(qū)區(qū)幾個符號和字母。
這本書介紹數(shù)學理論在互聯(lián)網(wǎng)上的運用,平時我們在使用互聯(lián)網(wǎng)搜索或者翻譯功能的時候,時常會感嘆電腦對自己的了解和它的聰明,其實背后的原理就是一個個精美的算法和大量數(shù)據(jù)的訓練。那些或者熟悉或者陌生的數(shù)學知識(聯(lián)合概率分布,維特比算法,期望最大化,貝葉斯網(wǎng)絡,隱形馬爾可夫鏈,余弦定律,etc),一步步構(gòu)建了我們現(xiàn)在所賴以生存的網(wǎng)上世界。
之所以覺得自己早已身不在起點,是因為上面這些數(shù)學知識,早已經(jīng)不在我的知識框架之內(nèi),就算曾經(jīng)學過,也不過是囫圇吞棗一樣的強記硬背,沒有領(lǐng)會過其中的真正意義。而今天想重頭在來學一次,其實已經(jīng)不可能了。且不說要花費多少的`精力和時間,還需要的是領(lǐng)悟力。而這一些,已經(jīng)不是我可以簡單付出的。
不像物理、化學需要復雜的實驗來驗證,很多數(shù)學的證明,幾乎只要有一顆聰明的頭腦和無數(shù)的草稿紙,可是光是這顆聰明的頭腦,就可以阻攔掉很多人。有人說多讀書就會聰明,我不否認,書本的確會提供很多知識,可是不同的人讀同一本書也會有不同的收貨,這就限制于每個人的知識框架和認知水平。就如一個數(shù)學功底好過我的人,看這本書,就會更容易理解里面的公式和推導出這些公式的其他運用點,而我,只能站在數(shù)學的門口,感嘆一句,它真的好美吧。
當然,我暫時無法在實際生活中運用這些數(shù)學公式,可是書中提到的一些方法論,還是很有幫助的
1)一個產(chǎn)業(yè)的顛覆或者創(chuàng)新,大部分來自于外部的力量,比如用統(tǒng)計學原理做自然語言處理。
2)基礎(chǔ)知識和基礎(chǔ)數(shù)據(jù)是很重要性,只有足夠多和足夠廣的數(shù)據(jù),才可以提供有效的分析,和驗證分析方法的好壞。
3)先幫用戶解決80%的問題,在慢慢解決剩下的20%的問題;
4)不要等一個東西完美了,才發(fā)布;
5)簡單是美,堅持選擇簡單的做法,這樣會容易解釋每一個步驟和方法背后的道理,也便于查錯。
6)正確的模型也可能受噪音干擾,而顯得不準確;這時不應該用一種湊合的修正方法加以彌補,而是要找到噪音的根源,從根本上修正它。
7)一個人想要在自己的領(lǐng)域做到世界一流,他的周圍必須有非常多的一流人物。
數(shù)學之美讀書筆記【2】
讀完本書,第一感受:次奧!原來數(shù)學如此多的原理模型概念都可以用去解決各種IT技術(shù)問題啊。特別是語言識別和自然語言處理這類問題完全就是建立在數(shù)學原理之上的。總之,這本書就是用非常深入淺出的話去說明如何用數(shù)學方法去解決計算機的各種工程問題。這是一本講道,而不是術(shù)的書。 要完全讀懂這本書,我覺得至少需要掌握這三門課:高等數(shù)學,離散數(shù)學,還有概率論與數(shù)理統(tǒng)計。唉..我當初數(shù)學學得太水了,還掛了高數(shù)啊...有好的概念沒看懂,以后有時間在好好看吧。如果想搞計算機研究的話,數(shù)學基礎(chǔ)必不可少,別總在抱怨各種數(shù)學課上的東西一輩子都用不著。
發(fā)現(xiàn)作者對人類自然發(fā)展的認識非常深,其從語言,文字,數(shù)學的產(chǎn)生發(fā)展,信息的傳播記錄得出了這個結(jié)論:信息的產(chǎn)生傳播接收反饋,和今天最先進的通信在原理上沒有任何差別。就算是科學上最高深的技術(shù),那也是模擬我們生活中的一些基本原理。
我們今天使用的十進制,就是我們扳手指扳了十次,就進一次位。而瑪雅文明他們數(shù)完了手指和腳指才開始進位,所以他們用的是二十進制。實際上阿拉伯數(shù)字是古印度人發(fā)明的,只是歐洲人不知道這些數(shù)字的真正發(fā)明人是古印度,而就把這功勞該給了“二道販子”阿拉伯人。
語言的數(shù)學本質(zhì)
任何一種語言都是一種編碼方式,比如我們把一個要表達的意思,通過語言一句話表達出來,就是利用編碼方式對頭腦中的信息做了一次編碼,編碼的結(jié)果就是一串文字,聽者則用這語言的解碼方法獲得說話者要表達的信息。
自然語言處理模型
計算機是很笨的,他們唯一會做的就是計算。自然語言處理在數(shù)學模型上是基于統(tǒng)計的,說一個句子是否合理,就看看他出現(xiàn)的可能性大小如何,可能性就是用概率來衡量,比如一個句子,出現(xiàn)的概率為1/10^10,另一個句子出現(xiàn)的概率為1/10^20,那么我們就可以說第一個句子比第二個句子更加合理。當然這要求有足夠的觀測值,他有大數(shù)定理在背后支持。
最早的中文分詞方法
這句話:“同學們呆在圖書館看書”,如何分詞?應該是這樣:同學們/呆在/圖書館/看書.最先的方法是北航一老師提出的查字典方法,就是把句子從左道右掃描一遍,遇到字典里面出現(xiàn)的詞就標示出來,遇到復合詞如(北京大學)就按照最長的分詞匹配,遇到不認識的字串就分割成單個字,于是中文的分詞就完成了。但是這只能解決78成的.分詞問題,但是“像發(fā)展中國家”這種短語它是分不出來的。后來大陸用基于統(tǒng)計語言模型方法才解決了。
隱含馬可夫模型(沒這么看懂)
一直被認為是解決打多數(shù)自然語言處理問題最為快速有效的方法,大致意思是:隨機過程中各個狀態(tài)的概率分布,只與他的前一個狀態(tài)有關(guān)。比如對于天氣預報,我們只假設(shè)今天的氣溫只與昨天有關(guān)而與前天沒有關(guān)系,這雖然不完美,但是以前不好解決的問題都可以給出近視值了。
一個讓我印象深刻的觀點:
小學生和中學生其實沒有必要花那么多時間去讀書,其覺得最主要的是孩子們的社會經(jīng)驗,生活能力,和那時候樹立起來的志向,這將幫助他們一生。而中學生階段花很多時間比同伴多讀的課程,在大學以后可以用非常短的時間就可以讀完。因為在大學階段,人的理解能力要強很多,比如中學要花500小時才能搞明白的內(nèi)容,大學可能花100小時就搞定了。學習和教育是一個人一輩子的事情,很多中學成績好的人進入大學后有些就表現(xiàn)不太好了,要有不斷學習的動力才行。
余弦定理和新聞分類
我在新浪干過一年多新聞,這篇認真看了一篇,很吃驚原理cos x與新聞分析也有關(guān)系啊。google的新聞服務是由計算機自動整理分類的。而傳統(tǒng)的媒體如門戶網(wǎng)站是讓編輯讀懂新聞,找到主題,再分類分級別的,真苦逼啊...計算機自動分類原理是這樣:如一篇新聞有10000個詞,組成一個萬維向量,這個向量就代表這篇新聞,可以通過某種算法表達這個新聞主題的類型,如果兩個向量的方向一致,說明對應的新聞用詞一致,方向可用夾角表示,夾角可用余弦定理表示,所以當夾角的余弦值接近于1時,這兩篇新聞就可以歸為一類了。
沒看懂的東西:
布爾代數(shù):布爾代數(shù)把邏輯學和數(shù)學合二為一,給了我們一個全新的視角看世界...
網(wǎng)絡爬蟲的基本原來是利用了圖論的廣度優(yōu)先搜索和深度優(yōu)先搜索...
搜索引擎的結(jié)果排名用了稀疏矩陣的計算...
地圖最基本的計算是利用了有限狀態(tài)機和圖論的最短路徑...
密碼學原理,最大熵模型,拼音輸入法的數(shù)學模型,布隆過濾器,貝葉斯網(wǎng)絡等等...
任何事物都有它的發(fā)展規(guī)律,當我們認識了規(guī)律后,應當在生活工作中遵循規(guī)律,希望大家透過IT規(guī)律的認識,可 以舉一反三的總結(jié)學習認識規(guī)律,這樣有助于自己的境界提升一個層次。
任何問題總是能找到相應的準確數(shù)學模型,一個正確的數(shù)學模型在形式上應當是簡單的,一個好的方法在形式上應當也是簡單的。簡單才是美。
[數(shù)學之美讀書筆記]
【數(shù)學之美讀書筆記】相關(guān)文章:
雙語文摘之自然之美09-23
思想之美才是人生之美10-02
男人都愛的線條之美07-30
秋菊之美簡歷封面07-28
成人之美造句09-11
論藝術(shù)的“靜穆”之美09-12
雙語詩歌:大海之美11-09
話說天下之經(jīng)典英語美句07-25
用成人之美造句08-12
男士美白秘籍之如何用香蕉美白09-30