- 相關(guān)推薦
會計(jì)數(shù)據(jù)倉庫建立探討會計(jì)畢業(yè)論文
隨著會計(jì)信息化的發(fā)展,我國的會計(jì)軟件種類也越來越多,但是往往都自成體系,采用的數(shù)據(jù)庫平臺和數(shù)據(jù)結(jié)構(gòu)也就大不相同。由此使得不同的會計(jì)軟件之間,以及會計(jì)軟件與會計(jì)數(shù)據(jù)相關(guān)的業(yè)務(wù)軟件之間的數(shù)據(jù)交換,形成了一定的障礙。2004年9月20日,GB/T19581—2004《信息技術(shù)會計(jì)核算軟件數(shù)據(jù)接口》國家標(biāo)準(zhǔn)的頒布,在很大程度上解決了會計(jì)軟件之間數(shù)據(jù)交換的障礙。只要符合會計(jì)數(shù)據(jù)接口標(biāo)準(zhǔn)要求,實(shí)現(xiàn)會計(jì)信息化的單位就很輕易將歷年的會計(jì)數(shù)據(jù)導(dǎo)出,通過建立數(shù)據(jù)倉庫,并利用會計(jì)核算軟件對數(shù)據(jù)倉庫的數(shù)據(jù)進(jìn)行相關(guān)的財(cái)務(wù)分析和決策。同時利用數(shù)據(jù)倉庫對繁多的會計(jì)數(shù)據(jù)進(jìn)行治理,不僅將進(jìn)步會計(jì)數(shù)據(jù)利用率,通過利用數(shù)據(jù)倉庫進(jìn)行財(cái)務(wù)分析,還可以進(jìn)步治理決策的質(zhì)量。
一、會計(jì)核算軟件標(biāo)準(zhǔn)數(shù)據(jù)接口基本內(nèi)容
由于目前財(cái)務(wù)軟件的平臺復(fù)雜多樣,而這些軟件之間的數(shù)據(jù)沒有一個同一的數(shù)據(jù)規(guī)范,造成不同財(cái)務(wù)軟件之間數(shù)據(jù)交流相當(dāng)困難。GB/T19581—2004《信息技術(shù)會計(jì)核算軟件數(shù)據(jù)接口》的頒布主要是對國內(nèi)所有正在使用的會計(jì)核算軟件(包括含會計(jì)核算功能的會計(jì)信息系統(tǒng)、治理信息系統(tǒng)等)規(guī)定同一的數(shù)據(jù)輸出的內(nèi)容和格式。會計(jì)核算軟件數(shù)據(jù)接口分兩個部分,一部分是規(guī)定其內(nèi)容,包括電子賬簿、會計(jì)科目、科目余額、記賬憑證、報(bào)表等;另一部分規(guī)定其輸出的格式要求,包括文本文件的輸出方式和XML 文件的輸出方式,并要求以一定期間為單位導(dǎo)出會計(jì)核算數(shù)據(jù)。
二、數(shù)據(jù)倉庫與接口標(biāo)準(zhǔn)之間的關(guān)系
William H. Inmon 在1993年寫的《Building the Data Warehouse》論著中,將數(shù)據(jù)倉庫定義為:“一個面向主題的、集成的、隨時間變化的、非易失性數(shù)據(jù)的集合,用于支持治理層的決策過程”。由定義可知,數(shù)據(jù)倉庫的主要特征為:面向主題性、數(shù)據(jù)的集成性、穩(wěn)定性、時變性。通過數(shù)據(jù)倉庫,不同層次的治理職員可以進(jìn)行各種治理決策的分析。數(shù)據(jù)倉庫中存放的是數(shù)據(jù)的歷史值,并且是靜態(tài)的歷史數(shù)據(jù),可以定期添加,具有低訪問率,高訪問量的特點(diǎn)。而這些數(shù)據(jù)都來源于其他不同的數(shù)據(jù)庫。
目前的多數(shù)財(cái)務(wù)軟件在數(shù)據(jù)庫的選用、數(shù)據(jù)庫的格式上大不相同,導(dǎo)致各財(cái)務(wù)軟件之間不能互相交換數(shù)據(jù),也給審計(jì)軟件導(dǎo)進(jìn)財(cái)務(wù)軟件的數(shù)據(jù)帶來了一定的困難。而以往數(shù)據(jù)倉庫在財(cái)務(wù)上的應(yīng)用,基本上都是面向單個企業(yè)的單獨(dú)開發(fā)。GB/T19581—2004《信息技術(shù)會計(jì)核算軟件數(shù)據(jù)接口》的頒布,在很大程度上解決了這種障礙。按照會計(jì)核算軟件數(shù)據(jù)接口標(biāo)準(zhǔn)的數(shù)據(jù)結(jié)構(gòu)和內(nèi)容,建立一個標(biāo)準(zhǔn)數(shù)據(jù)庫即數(shù)據(jù)倉庫,從而企業(yè)可以根據(jù)會計(jì)數(shù)據(jù)接口標(biāo)準(zhǔn)要求,將原數(shù)據(jù)庫中的數(shù)據(jù)轉(zhuǎn)換為標(biāo)準(zhǔn)規(guī)定的格式,并可以通過數(shù)據(jù)倉庫將符合要求的會計(jì)數(shù)據(jù)從會計(jì)核算軟件導(dǎo)進(jìn)或?qū)С?從而實(shí)現(xiàn)對數(shù)據(jù)倉庫進(jìn)行相關(guān)的財(cái)務(wù)分析及決策。
三、數(shù)據(jù)倉庫的模型設(shè)計(jì)
數(shù)據(jù)倉庫創(chuàng)建之前首先要根據(jù)需求明確所構(gòu)建內(nèi)容的主題域。在根據(jù)需求分析確定主題域后,就可以通過建立數(shù)據(jù)模型對數(shù)據(jù)倉庫進(jìn)行描述。模型是對現(xiàn)實(shí)世界進(jìn)行的抽象描述,在信息治理中要實(shí)現(xiàn)對信息的治理與分析,就要依靠數(shù)據(jù)模型將現(xiàn)實(shí)世界的事物轉(zhuǎn)換為信息世界的數(shù)據(jù)。創(chuàng)建數(shù)據(jù)倉庫所采用的模型主要有概念模型、邏輯模型、物理模型。
(一)主題域的確定
數(shù)據(jù)倉庫設(shè)計(jì)的關(guān)鍵是主題域的確定,整個數(shù)據(jù)倉庫的數(shù)據(jù)都是圍繞主題和軟件標(biāo)準(zhǔn)數(shù)據(jù)接口而組織的,主要用于對企業(yè)的財(cái)務(wù)進(jìn)行分析。根據(jù)數(shù)據(jù)接口標(biāo)準(zhǔn)規(guī)定的數(shù)據(jù)文件,主題可以分為以下幾類:
資產(chǎn)負(fù)債表主題:主要分析企業(yè)某一特定日期內(nèi)的財(cái)務(wù)狀況,還可以進(jìn)一步細(xì)化分為資產(chǎn)主題,負(fù)債主題,所有者權(quán)益主題;
現(xiàn)金流量表主題:分析企業(yè)在一定會計(jì)期間現(xiàn)金及現(xiàn)金等價物的流進(jìn)和流出情況;
利潤表主題:用于分析企業(yè)在一定會計(jì)期間的經(jīng)營成果;
所有者權(quán)益變動表主題:分析企業(yè)一定時期所有者權(quán)益變動的情況;
財(cái)務(wù)分析指標(biāo)主題:通過以上主題來分析企業(yè)一定時期的營運(yùn)能力、償債能力、獲利能力及發(fā)展能力等。
(二)概念模型設(shè)計(jì)
星型模型和雪花型模型是概念模型設(shè)計(jì)常使用的兩種模型。雪花型模型是對星型模型的擴(kuò)展,適用于具有復(fù)雜結(jié)構(gòu)數(shù)據(jù)倉庫的應(yīng)用,星型模型是最常使用的模型。模型設(shè)計(jì)主要用于設(shè)置事實(shí)表與維表之間的連接,使每個維表通過主鍵與外鍵連接,進(jìn)而實(shí)現(xiàn)與事實(shí)表的連接。概念模型的設(shè)計(jì)就是要根據(jù)需求,確定業(yè)務(wù)中的指標(biāo)實(shí)體和維實(shí)體,以及在實(shí)體間建立聯(lián)系,概念模型設(shè)計(jì)后可以在一些開發(fā)工具中,利用一些技術(shù)功能直接轉(zhuǎn)換為物理模型,再天生數(shù)據(jù)庫,從而節(jié)約了時間并進(jìn)步了效率。
(三)邏輯模型設(shè)計(jì)
通常在概念模型設(shè)計(jì)好后,還要依靠邏輯模型來實(shí)現(xiàn)概念模型到物理模型的轉(zhuǎn)換。由于目前數(shù)據(jù)庫都建立在關(guān)系數(shù)據(jù)庫基礎(chǔ)上,所以所采用的邏輯模型主要是關(guān)系模型。會計(jì)核算軟件數(shù)據(jù)接口標(biāo)準(zhǔn)對所涉及的數(shù)據(jù)元素規(guī)定了同一的格式,在建立的邏輯模型中,要根據(jù)數(shù)據(jù)接口的規(guī)定對數(shù)據(jù)的字段進(jìn)行格式描述。邏輯模型設(shè)計(jì)主要包括事實(shí)表,維表設(shè)計(jì)以及粒度的劃分。
(1)事實(shí)表。直接反映了數(shù)據(jù)倉庫中應(yīng)用的主題,是星型結(jié)構(gòu)中最主要的表,包含了數(shù)據(jù)倉庫中最主要的信息,如資產(chǎn)負(fù)債表、現(xiàn)金流量表、利潤表、所有者權(quán)益變動表、財(cái)務(wù)分析表。而數(shù)據(jù)倉庫的數(shù)據(jù)都是來自于不同數(shù)據(jù)接口的數(shù)據(jù)庫,在進(jìn)行數(shù)據(jù)倉庫的邏輯模型設(shè)計(jì)時,還要確定各表中的數(shù)據(jù)元素即字段與數(shù)據(jù)源的邏輯關(guān)系,以便核算軟件按照接口標(biāo)準(zhǔn)要求輸出文件。其中的對應(yīng)關(guān)系可以回納為:第一種是數(shù)據(jù)元素和數(shù)據(jù)源的逐一對應(yīng),即可以在核算軟件中找到與數(shù)據(jù)元素直接對應(yīng)的表與字段;第二種是數(shù)據(jù)元素需數(shù)據(jù)源通過計(jì)算得到,即必須對數(shù)據(jù)源進(jìn)行計(jì)算處理才能滿足標(biāo)準(zhǔn)規(guī)定的數(shù)據(jù)元素的需要;最后一種對應(yīng)關(guān)系是依據(jù)邏輯判定非源于特定數(shù)據(jù)源的數(shù)據(jù)。數(shù)據(jù)源的確定和對應(yīng)關(guān)系是會計(jì)軟件輸出符合標(biāo)準(zhǔn)數(shù)據(jù)的邏輯基礎(chǔ)。由于過于龐大的事實(shí)表在表的處理、備份和恢復(fù)、用戶的查詢等方面需要較長的時間,在設(shè)計(jì)時要留意使事實(shí)表盡可能地小。
(2)維表。主要用來描述事實(shí)表,與事實(shí)表有著非常重要的關(guān)系,在事實(shí)表中大多數(shù)屬性都要依靠于維表,維表的主鍵組成了事實(shí)表的外鍵,每個維表都通過主鍵與事實(shí)表的外鍵連接,實(shí)現(xiàn)數(shù)據(jù)庫快速查詢。維表的屬性也要根據(jù)接口標(biāo)準(zhǔn)規(guī)定進(jìn)行規(guī)范定義。維表也會影響企業(yè)決策的因素,如不同企業(yè)、日期、指標(biāo)種別都是影響企業(yè)決策的因素,通過這些因素決策者可以按照不同企業(yè)不同日期不同指標(biāo)種別進(jìn)行決策分析。根據(jù)事實(shí)表設(shè)計(jì)的維表有會計(jì)期間維表、報(bào)表編碼維表、日期維表、企業(yè)維表等。
(3)粒度的劃分。粒度是指數(shù)據(jù)倉庫的數(shù)據(jù)單位中保存數(shù)據(jù)的細(xì)化或綜合程度的級別。通過粒度的劃分,決定了數(shù)據(jù)倉庫是采用單一粒度還是多重粒度,以及粒度的劃分層次。粒度級越低,細(xì)化程度越高;相反,粒度級越高,細(xì)化程度越低。粒度的劃分直接影響到數(shù)據(jù)倉庫中的數(shù)據(jù)量和信息查詢,以及進(jìn)一步進(jìn)行OLAP(聯(lián)機(jī)分析處理)和數(shù)據(jù)挖掘的效果。假如主題的數(shù)據(jù)量、信息量較多,對主題數(shù)據(jù)分析細(xì)化程度要求較高,就要根據(jù)用戶對數(shù)據(jù)倉庫應(yīng)用的需求,采用多重粒度進(jìn)行數(shù)據(jù)劃分。用低粒度即細(xì)化到月的數(shù)據(jù),保存近期的會計(jì)報(bào)表及財(cái)務(wù)分析指標(biāo)數(shù)據(jù),對時間較遠(yuǎn)的會計(jì)報(bào)表及財(cái)務(wù)分析指標(biāo)數(shù)據(jù)的保存用粒度較大即細(xì)化到年的數(shù)據(jù)。這樣既可以對財(cái)務(wù)近況進(jìn)行細(xì)節(jié)分析,又可以利用粒度較大的數(shù)據(jù)對財(cái)務(wù)趨勢進(jìn)行分析;否則采用單一粒度進(jìn)行劃分。
(四)物理模型設(shè)計(jì)
邏輯模型在物理系統(tǒng)中的體現(xiàn)模式,需要通過數(shù)據(jù)倉庫的物理模型設(shè)計(jì)來實(shí)現(xiàn)。包括邏輯模型中的各種實(shí)體表的具體化,包括表的數(shù)據(jù)結(jié)構(gòu)類型、索引策略、數(shù)據(jù)存放位置及數(shù)據(jù)存儲分配等。會計(jì)軟件數(shù)據(jù)接口標(biāo)準(zhǔn)中所要求的數(shù)據(jù)接口輸出數(shù)據(jù),包含接口標(biāo)準(zhǔn)要求的16個數(shù)據(jù)文件和1個格式說明文件,每個文件的文件名都進(jìn)行了嚴(yán)格的規(guī)定。同時在標(biāo)準(zhǔn)中對16個數(shù)據(jù)文件的81個數(shù)據(jù)元素也進(jìn)行了嚴(yán)格定義,首先,在物理模型設(shè)計(jì)中表的數(shù)據(jù)結(jié)構(gòu)應(yīng)根據(jù)接口標(biāo)準(zhǔn)要求,對數(shù)據(jù)的格式及內(nèi)容進(jìn)行同一的定義規(guī)范,如表的字段標(biāo)識符要采用三位數(shù)字進(jìn)行標(biāo)記,字段的類型長度最多為5位可變長字符。只要會計(jì)軟件的數(shù)據(jù)倉庫的數(shù)據(jù)接口符合接口標(biāo)準(zhǔn),就可以實(shí)現(xiàn)輸出符合標(biāo)準(zhǔn)的數(shù)據(jù)。其次,由于數(shù)據(jù)倉庫的數(shù)據(jù)量很大,通過索引的創(chuàng)建可以進(jìn)步數(shù)據(jù)存取的效率,通常按事實(shí)表的主鍵和外鍵來建立索引。在數(shù)據(jù)倉庫中首先需要為事實(shí)表設(shè)置索引,在為事實(shí)表的主鍵聲明約束時,應(yīng)該按照這些列的聲明次序創(chuàng)建一個惟一的索引。而對于使用頻率較高的外鍵,應(yīng)置于主鍵索引的前面,以進(jìn)步查詢效率。
數(shù)據(jù)倉庫中的數(shù)據(jù)可以通過數(shù)據(jù)庫訪問接口,將源數(shù)據(jù)庫中的數(shù)據(jù)轉(zhuǎn)換為標(biāo)準(zhǔn)格式的數(shù)據(jù)導(dǎo)進(jìn)。其中數(shù)據(jù)的存儲通常按數(shù)據(jù)的重要性、使用頻率以及對響應(yīng)時間的要求進(jìn)行分類,并將不同類型的數(shù)據(jù)分別存儲在不同的存儲設(shè)備中,其中重要性高、經(jīng)常存取并對響應(yīng)時間要求高的數(shù)據(jù)存放在高速存儲設(shè)備上,而存取頻率低或?qū)Υ嫒№憫?yīng)時間要求低的數(shù)據(jù)則可以存放在低速存儲設(shè)備上。
四、數(shù)據(jù)倉庫的創(chuàng)建
通過對數(shù)據(jù)倉庫中的事實(shí)表、維表的邏輯模型設(shè)計(jì),同時根據(jù)在物理模型中對各種表的存儲區(qū)間、方式的處理,在數(shù)據(jù)倉庫的實(shí)施過程,采用適當(dāng)?shù)臄?shù)據(jù)倉庫創(chuàng)建工具,就可以創(chuàng)建數(shù)據(jù)倉庫。目前用于創(chuàng)建數(shù)據(jù)庫的工具主要有SQL Server、Oracle10i、Sybase等。數(shù)據(jù)倉庫的創(chuàng)建可以根據(jù)具體情況選擇適合的開發(fā)工具。
五、數(shù)據(jù)的采集及轉(zhuǎn)換
數(shù)據(jù)倉庫的物理模型設(shè)計(jì)完成后,就要根據(jù)會計(jì)核算軟件數(shù)據(jù)接口標(biāo)準(zhǔn),來完成數(shù)據(jù)倉庫結(jié)構(gòu)的建立,實(shí)現(xiàn)數(shù)據(jù)倉庫和元數(shù)據(jù)庫的創(chuàng)建,然后就可以對數(shù)據(jù)倉庫進(jìn)行數(shù)據(jù)的加載。元數(shù)據(jù)庫是數(shù)據(jù)倉庫的靈魂,沒有元數(shù)據(jù)庫,用戶就無法對數(shù)據(jù)倉庫的數(shù)據(jù)進(jìn)行良好的定義、組織和治理。數(shù)據(jù)的采集及轉(zhuǎn)換是建立數(shù)據(jù)倉庫中最重要的處理過程之一,這一過程實(shí)際上是要把來自不同的操縱性數(shù)據(jù)源、不同的數(shù)據(jù)進(jìn)行集成,將非標(biāo)準(zhǔn)的數(shù)據(jù)轉(zhuǎn)化為在一定程度上的標(biāo)準(zhǔn)化的數(shù)據(jù)。采集之前首先需要對數(shù)據(jù)進(jìn)行預(yù)處理,即進(jìn)行預(yù)備工作包括清空工作區(qū)、預(yù)備區(qū)。由于數(shù)據(jù)倉庫中的數(shù)據(jù)來源十分復(fù)雜,這些數(shù)據(jù)在進(jìn)進(jìn)數(shù)據(jù)倉庫之前經(jīng)常需要在預(yù)備區(qū)對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,即將不同數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)進(jìn)行同一處理,如源數(shù)據(jù)庫中的數(shù)據(jù)類型與長度和標(biāo)準(zhǔn)規(guī)定的有所差別,就需要進(jìn)行數(shù)據(jù)的類型轉(zhuǎn)換、長度的截取等工作。數(shù)據(jù)的采集可以通過數(shù)據(jù)庫接口訪問源數(shù)據(jù)庫,將數(shù)據(jù)轉(zhuǎn)換為標(biāo)準(zhǔn)格式數(shù)據(jù)存進(jìn)數(shù)據(jù)倉庫,同時為了確保數(shù)據(jù)倉庫中數(shù)據(jù)質(zhì)量,還要對數(shù)據(jù)進(jìn)行必要的清理即篩選工作。數(shù)據(jù)的清理工作必須嚴(yán)格依據(jù)元數(shù)據(jù)的定義進(jìn)行,數(shù)據(jù)清理結(jié)束就可以將經(jīng)過凈化和轉(zhuǎn)換的數(shù)據(jù)加載到數(shù)據(jù)倉庫事實(shí)表中。實(shí)現(xiàn)的工具主要有SQL Sever、Oracle等。對數(shù)據(jù)提取以后,同樣也可以利用SQL語言實(shí)現(xiàn)對數(shù)據(jù)的加載。
六、數(shù)據(jù)倉庫的使用
在會計(jì)數(shù)據(jù)標(biāo)準(zhǔn)接口中,已經(jīng)將會計(jì)科目、會計(jì)憑證、會計(jì)賬簿、會計(jì)報(bào)表等中的數(shù)據(jù)納進(jìn),并進(jìn)行了同一規(guī)范。因此可以通過標(biāo)準(zhǔn)數(shù)據(jù)接口將每年的會計(jì)數(shù)據(jù)保存到數(shù)據(jù)倉庫。按照會計(jì)數(shù)據(jù)接口標(biāo)準(zhǔn)要求,將會計(jì)數(shù)據(jù)倉庫中的歷年數(shù)據(jù)輸進(jìn)到會計(jì)核算軟件中,并利用會計(jì)核算軟件對其進(jìn)行相關(guān)的財(cái)務(wù)分析、經(jīng)濟(jì)遠(yuǎn)景猜測,以幫助治理者為企業(yè)的將來做出正確的決策。隨著數(shù)據(jù)接口標(biāo)準(zhǔn)的推廣實(shí)施,基于會計(jì)核算軟件數(shù)據(jù)接口的數(shù)據(jù)分析技術(shù)和方法會越來越多,并且應(yīng)用范圍也會越來越廣泛。
【參考文獻(xiàn)】
[1] 會計(jì)核算軟件數(shù)據(jù)標(biāo)準(zhǔn)接口國家標(biāo)準(zhǔn)實(shí)施指南編委會.GB/T 19581—2004《信息技術(shù)會計(jì)核算軟件數(shù)據(jù)標(biāo)準(zhǔn)接口》實(shí)施指南[S].北京:中國標(biāo)準(zhǔn)出版社,2005.
[2] 陳京民.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術(shù)[M].北京:電子產(chǎn)業(yè)出版社,2007.
[3] 池太崴.數(shù)據(jù)倉庫結(jié)構(gòu)設(shè)計(jì)與實(shí)施[M].北京:電子產(chǎn)業(yè)出版社,2005.
【會計(jì)數(shù)據(jù)倉庫建立探討會計(jì)畢業(yè)論文】相關(guān)文章:
傳統(tǒng)電算會計(jì)內(nèi)部控制變革探討畢業(yè)論文01-01
加入WTO后我國建立環(huán)境會計(jì)的必要性探討04-30
會計(jì)畢業(yè)論文11-07
對環(huán)境會計(jì)要素確認(rèn)的探討04-30
對在我國實(shí)行環(huán)境會計(jì)的探討04-30
會計(jì)教學(xué)改革探討04-30
對建立環(huán)境會計(jì)核算體系的構(gòu)想04-27
建立完善的會計(jì)體系迫在眉睫05-01
會計(jì)畢業(yè)論文 -論文03-13
會計(jì)類的畢業(yè)論文04-28