發(fā)布時間:2023-03-21 17:09:54
序言:寫作是分享個人見解和探索未知領(lǐng)域的橋梁,我們?yōu)槟x了8篇的數(shù)據(jù)信息論文樣本,期待這些樣本能夠為您提供豐富的參考和啟發(fā),請盡情閱讀。
城市軌道交通信號系統(tǒng)的DCS網(wǎng)絡(luò)包含有線部分和無線部分。有線網(wǎng)絡(luò)部分是指軌旁設(shè)備之間的數(shù)據(jù)通信,為信號系統(tǒng)提供專用有線信息傳輸,為控制中心、車站、場段之間提供有線傳輸通道,建立局域網(wǎng)連接。無線部分主要是列車上的移動無線設(shè)備和地面軌旁無線單元之間建立的車地雙向通信。如上所述,在信號系統(tǒng)的DCS網(wǎng)絡(luò)中,可以根據(jù)不同的組網(wǎng)方式,構(gòu)建不同的網(wǎng)絡(luò)結(jié)構(gòu),形成連接信號系統(tǒng)相關(guān)設(shè)備的通信網(wǎng)。而在這樣的網(wǎng)絡(luò)中,傳遞的信息就包含大量的管理信息、行車數(shù)據(jù)信息、ATS信息、維護信息、數(shù)據(jù)記錄信息等。DCS系統(tǒng)網(wǎng)絡(luò)連接設(shè)備一般連接方式需要說明的是DCS網(wǎng)絡(luò)結(jié)構(gòu)是多樣的,隨著實際地鐵線路情況、所連接的設(shè)備情況、以及技術(shù)發(fā)展和應(yīng)用情況有不同變化。從圖1中可以看出,信號系統(tǒng)DCS網(wǎng)絡(luò)具有連接設(shè)備類型多、數(shù)量大,信息傳輸種類繁多的特點。如果在DCS網(wǎng)絡(luò)中信息沒有合理的傳輸定義,使網(wǎng)絡(luò)中任何一個數(shù)據(jù)幀的傳輸都要遍及整個網(wǎng)絡(luò),導致所有與網(wǎng)絡(luò)連接的設(shè)備都接收到,這樣就會嚴重的消耗掉網(wǎng)絡(luò)整體帶寬。因此,在DCS網(wǎng)絡(luò)傳輸信息量較大時(如早、晚運行高峰時等),如不對網(wǎng)絡(luò)進行合理設(shè)置,就可能產(chǎn)生網(wǎng)絡(luò)風暴。網(wǎng)絡(luò)風暴發(fā)生時,與網(wǎng)絡(luò)連接的部分設(shè)備也可能會由于無法應(yīng)對網(wǎng)絡(luò)流量的大幅波動導致故障,進而引發(fā)故障面擴大的情況發(fā)生,對運營產(chǎn)生嚴重影響,這就需要對網(wǎng)絡(luò)中的信息傳輸進行合理優(yōu)化。
2VLAN技術(shù)特點及在DCS網(wǎng)絡(luò)中的應(yīng)用
VLAN技術(shù)是將局域網(wǎng)設(shè)備從邏輯上劃分成一個個網(wǎng)段,從而實現(xiàn)虛擬工作組數(shù)據(jù)交換。由于VLAN設(shè)置是在交換機上按邏輯來劃分,而不是傳統(tǒng)上的只能從物理上劃分,因此VLAN技術(shù)的出現(xiàn),可以滿足根據(jù)實際應(yīng)用情況,將同一物理局域網(wǎng)內(nèi)不同用戶邏輯地劃分成不同的廣播域需求。在設(shè)計VLAN并實現(xiàn)應(yīng)用時,首先要確定如何劃分VLAN。較為常見的VLAN劃分方式包括:按照端口劃分,按照MAC地址劃分、基于網(wǎng)絡(luò)層劃分、以及基于IP廣播和基于規(guī)則等方式。其中應(yīng)用最為廣泛、也是最有效的,是按照端口劃分的方式,這種劃分方式是根據(jù)以太網(wǎng)交換機的交換端口來劃分的,將交換機上的物理端口分為若干個組,每個組構(gòu)成一個虛擬網(wǎng)。由于基于端口劃分VLAN的優(yōu)點是定義VLAN成員非常簡單,只要在接入交換機上進行相關(guān)設(shè)置即可,操作相對簡單,適合任何大小的網(wǎng)絡(luò)。同時,這種配置方式適用于網(wǎng)絡(luò)環(huán)境比較固定的情況,與DCS網(wǎng)絡(luò)構(gòu)建后即在運營中不會輕易改變的實際情況較為符合,因此在地鐵信號系統(tǒng)DCS網(wǎng)絡(luò)交換機的配置中,一般都可以使用按照端口劃分VLAN的配置方式。以赫斯曼交換機為例,按照端口劃分VLAN,為不同端口賦予不同ID后的界面顯示情況綜上所述,為了有效避免信號系統(tǒng)DCS網(wǎng)絡(luò)風暴的發(fā)生,可以將交換機端口劃分到不同VLAN中。其原理為:在不同端口發(fā)出的所有數(shù)據(jù)幀上增加一個代表所屬VLAN編號的ID,各個交換機端口只有在接收到所屬VLANID的信息時,才會對該信息進行拆分處理,而在收到標有其他VLANID信息時,只會將該信息按照目的地址進行轉(zhuǎn)發(fā)。這樣就實現(xiàn)了通過在DCS網(wǎng)絡(luò)交換機上應(yīng)用VLAN技術(shù),有效控制網(wǎng)絡(luò)流量、降低網(wǎng)絡(luò)風暴發(fā)生概率的目標。并且通過在交換機上進行VLAN的劃分,可以起到減少項目建設(shè)的設(shè)備投資成本、簡化DCS網(wǎng)絡(luò)管理、提高網(wǎng)絡(luò)安全性的作用。這里需要提出的是,有必要找到適合于信號DCS網(wǎng)絡(luò)的劃分原則,結(jié)合實際應(yīng)用情況,將不同級別的信息進行合理區(qū)分。
3適用于DCS的VLAN劃分原則
由于地鐵信號系統(tǒng)DCS網(wǎng)絡(luò)具有連接設(shè)備數(shù)量、類型較多,信息傳輸種類繁多的特點,在按照端口劃分的VLAN配置方法對信號DCS網(wǎng)絡(luò)交換機等進行配置時,需要尋找到合適的原則,將信號系統(tǒng)DCS網(wǎng)絡(luò)中不同設(shè)備、不同信息類型進行全網(wǎng)的統(tǒng)一配置,既能有效避免網(wǎng)絡(luò)風暴,又有利于維護人員進行維修檢查。這就需要根據(jù)網(wǎng)絡(luò)端口是否有用、該端口在網(wǎng)絡(luò)中的作用、所傳輸?shù)男畔?nèi)容和特點等特征,將網(wǎng)絡(luò)端口有序劃分。例如,在網(wǎng)絡(luò)的列車自動控制(ATC)信息、列車自動監(jiān)控(ATS)信息、維護管理信息等帶有不同功能及目地的信息,劃分到不同的VLAN中。在信息有效傳輸?shù)耐瑫r,也可以提高網(wǎng)絡(luò)的安全性能。建議按照以下原則進行層層劃分。
1)由于信號系統(tǒng)涉及列車行車安全,因此可先將交換機上多余端口統(tǒng)一劃入“無用端口”的VLAN中,這樣即使有其他設(shè)備接入到該端口上,也不會對有用端口間的網(wǎng)絡(luò)通信造成影響。
2)進一步將有用端口進行分類,如該端口在信號DCS網(wǎng)絡(luò)中只做收發(fā),不對信息進行拆分和處理,即可將其劃入“管理類”的VLAN中。
3)在DCS網(wǎng)絡(luò)中,與“管理類”信息對應(yīng)的是“業(yè)務(wù)類”信息,在此類信息中,建議先將涉及到列車控制安全的ATC信息獨立劃分出來,同時由于此類信息較為重要,需設(shè)計兩路,可以劃分至兩個不同的VLAN中。
4)另外,“業(yè)務(wù)類”信息還包含其他非ATC信息,也就是非安全信息。對這類信息的劃分,首先將其中的ATS信息獨立劃分出來,同樣建議為兩路。
5)同時,非安全類的信息也包含維護管理類信息,如維護支持、電源監(jiān)控類等信息也需要劃分到單獨一個VLAN中,此類信息可以不進行冗余設(shè)置。
6)其他非安全類信息也可以通過實際情況進行VLAN設(shè)置,可以獨立VLAN,也可統(tǒng)一劃入一個VLAN,根據(jù)實際情況進行設(shè)置即可。建議的VLAN劃分原則,以及該原則對應(yīng)在信號系統(tǒng)中的傳輸內(nèi)容示意。
4總結(jié)
關(guān)鍵詞:信息技術(shù)教育。
信息技術(shù)教育的主要目的是讓學生在了解計算機文化、初步掌握一些計算機基本知識和技能的同時,進一步激發(fā)學生的學習興趣、增強信息意識和創(chuàng)新意識、有效培養(yǎng)學生對信息的收集、處理、應(yīng)用和傳輸?shù)哪芰Γ囵B(yǎng)學生的自學能力和創(chuàng)造能力,在開發(fā)智力、實現(xiàn)學生信息素質(zhì)和創(chuàng)造素質(zhì)的教育。教學中要時刻注意信息技術(shù)教學不僅僅是傳授計算機的基礎(chǔ)知識,更不能像社會上片面追?quot;學而致用"的職業(yè)培訓,而應(yīng)把計算機作為一種現(xiàn)代化工具,來提高學生的綜合素質(zhì),培養(yǎng)他們用信息技術(shù)手段來解決問題的各種能力。
那么,怎樣才能做好信息技術(shù)課的教學呢?信息技術(shù)教學可分為三層臺階:一、理論課教學,二、上機課教學,三、課外實踐。所謂理論課教學主要內(nèi)容是課程的引入、基本知識與基本技能;上機課教學主要內(nèi)容是讓學生在鞏固性練習中,掌握知識,形成技能;課外實踐主要內(nèi)容是教會學生如何將信息技術(shù)應(yīng)用到實際中去。理論課教學是前提,上機課教學是手段,課外實踐教學是根本。下面結(jié)合自己的教學實際,談?wù)勅绾翁ず眠@三層"臺階"。
一、理論課教學
1、上好第一節(jié)信息技術(shù)課。
俗話說:良好的開端是成功的一半。教師為學生上的第一節(jié)信息技術(shù)課要結(jié)合典型事例(最好輔以相應(yīng)的多媒體演示)使學生對計算機的發(fā)展、應(yīng)用有一個比較系統(tǒng)、全面的了解,并從中感悟到學習信息技術(shù)的重要性,激發(fā)出學習的欲望,明確學習任務(wù)。在此基礎(chǔ)上,要讓學生明白:為了最大限度地利用有限課時,一方面教師對學習內(nèi)容和學習目標要做精心的設(shè)計和安排;另一方面,還需要他們怎樣的密切配合等等,讓學生有一個必要的心理準備,為今后的學習,尤其是上機課能充分利用好45分鐘開個好頭。
2、課堂教學應(yīng)以能力的培養(yǎng)為主。
對于新的課程內(nèi)容,只要學生能自學弄明白的問題,教師就不要用講授的方式進行教學。教師可以設(shè)計出層次分明的思考題,引導學生認真閱讀教材,用"自己學得"的知識解決"實際問題",并提供讓學生"各抒已見"的機會。最后教師再通過課堂小結(jié)使教學內(nèi)容系統(tǒng)化、完整化。而對于新技術(shù)、新名詞的教學,則要鼓勵學生大膽的設(shè)想與追蹤。從而培養(yǎng)學生的自習能力、綜合能力、創(chuàng)新能力。
3、利用多媒體教學手段,提高教學效率。
多媒體教學構(gòu)建了新型的教學模式,能給學生創(chuàng)設(shè)一個良好的認知環(huán)境,可以加深學生的識記成效,培養(yǎng)和發(fā)展學生的思維能力、觀察能力、想象能力和創(chuàng)造能力。因此,信息技術(shù)學科教師要能熟練運用多媒體教學手段,使自己的課堂教學內(nèi)容豐富而不繁雜,教學過程緊張但不忙亂,自身的教學效率與計算機的高效性和諧一致,使學生親身感受信息技術(shù)給人類帶來的全新變化。
4、理論課教學課時應(yīng)遠小于上機課。
信息技術(shù)是一門基礎(chǔ)工具課程,是用來處理其它事務(wù)的手段,因此培養(yǎng)信息技術(shù)基本技能是該課程的主要任務(wù)。所以傳統(tǒng)的課堂授課形式在信息技術(shù)教學中只適合完成像基礎(chǔ)知識、語言算法、小結(jié)討論等內(nèi)容的教學。上機課才是學生通過動手來領(lǐng)會、鞏固和運用知識的最有效的手段,是培養(yǎng)技能的基本途徑。
二、上機課教學
充分、有效的利用好學校現(xiàn)有的計算機設(shè)備是信息技術(shù)教學的關(guān)鍵,因此教育部已擬定,上機課時應(yīng)占信息技術(shù)課教學的70%以上。
1、有關(guān)操作的教學內(nèi)容應(yīng)當安排在機房進行。
信息技術(shù)課是一門實踐性很強的課,因此有關(guān)操作性比較強的教學內(nèi)容(如:Windows98的操作、Word的操作)應(yīng)安排在機房進行。對配有多媒體教學網(wǎng)或大屏幕投影機的現(xiàn)代化機房,能使教師有更多的機會營造有利于學生"主動發(fā)展"的空間。對暫不具備以上條件的機房,也應(yīng)常備一臺投影儀,教師要精心設(shè)計制作投影片以期最大限度地滿足高效率教學的需要。
2、采用任務(wù)驅(qū)動的教學方法,培養(yǎng)學生自學能力。
在上機課之前,要向?qū)W生提出本節(jié)課學習的要求、明確學習任務(wù),解決好為什么學的問題。學生通過自己閱讀教材,提出問題,并引導學生進行驗證操作,使學生在自己不斷的解決問題當中體驗成功的快樂,可增強學生的自信,并逐漸養(yǎng)成求知探索的習慣。此后結(jié)合教學大綱要求,提出每一個學習階段的學習任務(wù)。可能將學習任務(wù)明確化、通俗化、具體化。同時注意將任務(wù)簡化,同時將學生任務(wù)簡化為基礎(chǔ)與技巧兩部分,便于讓學生抓住重點,保持良好的學習情緒。比如:將Word使用分為基礎(chǔ)部分(常用菜單、常用與格式工具欄使用等)與技巧部分(專用工具欄、復(fù)雜選項、復(fù)雜格式等),基礎(chǔ)部分內(nèi)容嚴整量少,便于教學,務(wù)必嚴格把關(guān),確保每位學生都學會,技巧部分注意方法教學,不必一一細講,要引導學生學會摸索學習。也要注意將任務(wù)分層,對不同程度的學生提出相應(yīng)難易的任務(wù),因材施教。
3、讓學生在鞏固性練習中,進行知識的整合創(chuàng)造。
創(chuàng)造素質(zhì)教育的一大特點就是跨學科。傳統(tǒng)的學科教育往往強調(diào)了線性思維,而忽視了發(fā)散思維,這樣是很難培養(yǎng)出具有創(chuàng)造素質(zhì)的人才的。計算機的工具性,為以學生為主體的跨學科教育提供了極大的便利條件,教師應(yīng)讓學生在鞏固性練習中,多進行知識的整合創(chuàng)造。如用"畫筆"進行美術(shù)創(chuàng)作,用Word設(shè)計賀卡、辦報,用Music作曲、用Excel分析班級成績,用Internet進行信息交流等。這種學以致用的教學方法既有利于完成信息技術(shù)課程的教學任務(wù),又有利于開發(fā)學生智力、促進學生主動發(fā)展,使信息素質(zhì)和創(chuàng)造素質(zhì)的教育落到實處。
4、上好程序設(shè)計課,培養(yǎng)學生創(chuàng)造力。
學生用所學語句自己組合成程序,用來解決某些問題:畫圖、奏曲、解趣味數(shù)學題、進行成績分析等等。這個過程對學生而言就是創(chuàng)造,它對學生的思維能力、解決問題的能力、規(guī)劃能力和創(chuàng)造能力的培養(yǎng)是其它課程不能替代的,是性能價格比非常好的培養(yǎng)學生創(chuàng)造力的有效手段和途徑。
三、課外實踐課
"用計算機處理信息是二十一世紀的公民應(yīng)具有的基本技能之一"已成為人類的共識。因此,在中小學信息技術(shù)學習中會涌現(xiàn)出許多學生計算機愛好者,這些學生不滿足課堂所學的知識,對計算機的許多專業(yè)知識和應(yīng)用技術(shù)(尤其是電子游戲)表現(xiàn)出濃厚的興趣。學校、教師、家庭應(yīng)通過有組織、有計劃的課外實踐活動對這些學生的愛好給予保護、培養(yǎng)和正確引導,以保證學生在全面發(fā)展的基礎(chǔ)上學有所長,學有所用。
課外實踐作為課堂教學的拓展和延伸,可分程序設(shè)計和應(yīng)用技術(shù)兩大類進行輔導。
1、程序設(shè)計小組
中小學各個階段的程序設(shè)計課外實踐應(yīng)與青少年信息學奧林匹克競賽相結(jié)合。由于此類競賽對學生綜合素質(zhì)要求很高,只有心理素質(zhì)好、文化課成績優(yōu)異、熟練掌握一種計算機高級語言的學生才有可能在較高級的比賽中取得好成績。因此在課余可組織程序設(shè)計興趣小組。如Pascal語言的程序設(shè)計,通過學習使學生掌握分析問題、解決問題的方法。為國家計算機高級人才的早期培養(yǎng)盡基礎(chǔ)教育的責任。
2、應(yīng)用技術(shù)小組
在應(yīng)用技術(shù)的課外實踐中可把計算機當作信息處理的工具,讓學生在整合各科所學文化知識的基礎(chǔ)上進行豐富多彩的創(chuàng)作和信息交流活動。如用Frontpage自制網(wǎng)頁;用Word設(shè)計公益廣告、賀卡;用"畫筆"或Photoshop創(chuàng)作美術(shù)作品、電子相冊;用Authorware制作課件;普曲或合成音樂;通過Internet進行信息傳遞、資料查詢等等,這些活動打破了學科界限,使學生在輕松愉快地學到、鞏固了相關(guān)學科的知識和技能的同時,有效提高了應(yīng)用已有知識進行創(chuàng)造和規(guī)劃的能力,深受學生喜愛。由于指導這些活動對教師的綜合素質(zhì)要求較高,所以這樣做也有利于促進教師不斷提高業(yè)務(wù)水平和綜合素質(zhì)。
總之,信息技術(shù)教育應(yīng)以培養(yǎng)學生的信息素養(yǎng)和實踐能力為主要教學目標,信息素養(yǎng)是信息技術(shù)教育的主要教學中心,信息技術(shù)教育必須圍繞這個中心開展相應(yīng)的教學活動,使學生的信息素養(yǎng)成為與讀、寫、算一樣重要的的終身有用的基礎(chǔ)能力,同時,信息技術(shù)教育必須兼顧學生的全面發(fā)展和多種能力的培養(yǎng),注重學生的精神、道德、文化和社會等多個方面的發(fā)展,培養(yǎng)學生的批判性思維、創(chuàng)造性思維和問題解決能力,因此,信息技術(shù)教育是以培養(yǎng)學生的信息素養(yǎng)為核心,面向?qū)W生全面發(fā)展的課程。
〖參考文獻〗
《中國電腦教育報》。
關(guān)鍵詞:單片機電話主叫信息識別FSK數(shù)據(jù)通信
電話主叫識別信息發(fā)送及接收(俗稱來電顯示),簡稱CID(CallingIdentifyDelivery),是電信局向被叫電話用戶提供的一種服務(wù)項目,是指在被叫用戶終端設(shè)備上顯示主叫電話號碼、主叫用戶姓名、呼叫日期和時間等主叫識別信息并進行存儲,以供用戶查閱的服務(wù)項目。被叫用戶根據(jù)顯示的主叫識別信息而決定是否接聽電話,可以避開一些不愿接聽或不友好的電話。利用這個功能可以進行FSK信息解碼的電話網(wǎng)數(shù)據(jù)通信,應(yīng)用于實際生活中。
1電話主叫識別原理和傳送協(xié)議
實現(xiàn)電話主叫信息識別業(yè)務(wù)的基本方法是,發(fā)端程序交換機將主叫電話號碼等信息通過局間指令系統(tǒng)傳磅給終端交換機,終端交換機再將主叫識別信息以移頻鍵控FSK(Frequency-ShiftKeying)或雙音多頻DTMF(DualToneMulti-Frequency)方式,在第一次振鈴或第二次振鈴間隔期前傳送給被叫用戶終端設(shè)備。我國的通信行業(yè)標準明確規(guī)定,統(tǒng)一采用FSK方式提供主叫電話來顯示服務(wù)。在一次呼叫中,若被叫用戶申請了CID業(yè)務(wù),則電信局的終端交換機就會向該被叫用戶傳送主叫識別信息數(shù)據(jù)。傳送流程與時序如圖1所示。
其中A、B、C、D、E為數(shù)據(jù)傳送時的狀態(tài)持續(xù)時間,各段時間值如表1所列。在數(shù)據(jù)傳送前或傳送過程中,如果用戶摘機,則傳送停止,但呼叫處理正常進行。
表1CID信號傳送各段時間值
符號時間值說明
tA1s第一次鈴流信號
tB0.5s<tB<1.5s第一次振鈴結(jié)束與數(shù)據(jù)傳送開始之間的時間間隔
tC≤2.9s傳送數(shù)據(jù)的時間,包括信道占用信號和標志信號
tD≥200ms數(shù)據(jù)傳送結(jié)束與第二次振鈴開始的時間間隔
tE1s第二次鈴流信號
tB+C+D≤3.6s各時段可根據(jù)具體情況確定
2主叫識別信息數(shù)據(jù)格式
FSK主叫識別信息數(shù)據(jù)的傳輸格式有兩種:單數(shù)據(jù)消息格式SDMF(SingleDataMessageFormat)和復(fù)合數(shù)據(jù)消息格式MDMF(MultipleDataMessageFormat)。前者的結(jié)構(gòu)簡單,可容納的信息內(nèi)容較少,如主叫號碼、日期和時間;后者的結(jié)構(gòu)比較復(fù)雜,可容納的信息長度較長,除單數(shù)據(jù)格式內(nèi)容以外還可以主叫用戶的姓名等。本文主要介紹FSK主叫信息數(shù)據(jù)格式的接收。
單數(shù)據(jù)消息格式由消息頭和消息體組合,消息頭由消息類型和消息長度組成,它們均為8位字。消息類型的值來識別消息的特征;消息長度指明后面所跟消息字的長度。消息體包括交換機需傳給終端用戶的消息。消息體可容納1~255個8位的消息字。每個字用8位帶校驗位的7位ASCII編碼字符集表示。
一個完事的消息幀由信道占用信號、標志信號、數(shù)據(jù)信息和校驗字組成。信道占用信號和標志信號用來提示電話終端準備接收數(shù)據(jù);校驗字用來作差錯檢查,如圖2所示。
①信道占用信號。這是發(fā)送主叫信息時要首先發(fā)出的頭標志,由一組300個連續(xù)的“0”和“1”交替地組成。其第一個位為“0”,最后一個位為“1”。在通話狀態(tài)下,此信號不發(fā)送。
②標志信號。在掛機狀態(tài)下,程控交換機向用戶發(fā)送主叫信息時要先發(fā)送的第二個標志信號,由180個標志位(邏輯“1”)組成。在通話狀態(tài)下,此信號不發(fā)送。
③標志位。程控交換機根據(jù)線路使用情況隨機插入的標志位,由0~10個邏輯“1”組成。
④數(shù)據(jù)字。主叫信息,每個數(shù)據(jù)字之前先行一次“0”作起始位,在最后加一位“1”作結(jié)束位,每個數(shù)字的最低位先發(fā)送。這樣,實際每個字為10位,即1PXXXXXXX0,其中P為奇偶校驗位。
電話主叫信息數(shù)據(jù)傳送時,信道占用信號首先發(fā)送,后接標志信號,最后連續(xù)發(fā)送數(shù)據(jù)字。根據(jù)數(shù)據(jù)傳送情況,間隔地插入一些標志位。一般標志位會加在如下字的傳送之間:
a.消息類型字與消息長度之間;
b.消息長度字與第一個參考數(shù)字或消息字之間;
c.參數(shù)類型字與相應(yīng)的參數(shù)長度字之間;
d.參考長度字與第一個參考字之間;
e.最后一個參數(shù)字與下一個參數(shù)類型字之間;
f.最后一個參考字或消息字與校驗字之間。
單數(shù)據(jù)消息格式數(shù)據(jù)傳送按消息類型(04H)、消息長度、消息字、月、日、時、分、主叫號碼(或“O”或“P”)的順序排列組成消息進行傳送。所有的消息字和參數(shù)字都有奇數(shù)偶校驗位,采用奇偶校驗的方式傳送。
3電話FSK信息通信電路設(shè)計
本文以FSK信息解調(diào)器SM8220P芯片與單片機及外電路接口為例,介紹FSK信息的通信接收方法。SM8220P解調(diào)器是日本NPC公司生產(chǎn)的雙列直插、低功耗CMOS集成電路FSK解調(diào)芯片,其解調(diào)器的引腳功能如表2所列。
表2SM8220P引腳功能
符號引腳功能
TIP-RING1,2電話信號輸入端。信號輸入必須隔直流
AGND3模擬地,要通過一個電容接地
RDIN4振鈴檢測輸入。要把振鈴信號經(jīng)衰減后連接到此引腳
RDRC5振鈴檢測RC延時電路,低電平有效
RDET6振鈴檢測輸出,內(nèi)部接施密特觸發(fā)電路。當為低電平時,表明檢測到振鈴信號輸入;不用時應(yīng)接地
PWDN7掉電控制,平時應(yīng)保持為低電平。若為高電平,進入掉電工作模式,COSCOUT、CDET和DOUT自動被設(shè)置成高電平,AGND、FOUT被設(shè)置成高阻抗狀態(tài)
GND8器件地
OSCIN/CLKIN9振蕩放大器輸入,外部振蕩放入器信號經(jīng)此引腳輸入
OSCOUT10振蕩放大器輸出,使用外部振蕩信號時必須開路
CDET11載波檢測輸出端,低電平有效。為低電平時,表明此時有FSK載波信號輸入
NC12空腳
DOUT13數(shù)據(jù)輸出,平時為高電平。當CDET=0時,表明此時電話經(jīng)上有一個有效的FSK信號輸入,經(jīng)解調(diào)后由該腳輸出
DMIN14解調(diào)器輸入端
FOUT15FSK帶通濾波器輸出端,通過一個電容耦合連接到DMIN
VDD16電源正極(3~5.5V)
SM8220P遵循Bell202和ITU-TV.23協(xié)議標準,以連續(xù)二進制脈沖頻移鍵控信號的方式傳輸,傳輸速率為1200bps。支持FSK號碼顯示和姓名顯示等多種功能;芯片內(nèi)部包含電源掉電檢測電路、振鈴檢測電路和載波檢測電路;信號輸入檢測靈敏度高,電源工作電壓較寬(3~5.5V),是進行電話FSK信息解碼通信的較好的集成芯片。
為實現(xiàn)電話FSK信息的接收,采用P87LPC764單片機控制SM8220P電路,以完成電話FSK信息解碼通信的工作。電話FK信息通信具體電路如圖3所示。
從圖3中可知,對于從電話線上傳輸來的FSK信號,信號傳送在第一次振鈴和第二次振鈴之間。振鈴信號經(jīng)過整流、分壓,加到TIL113光電耦合器件的發(fā)射管上,使發(fā)射管有電流通過而發(fā)光,照射到光敏三極管的基極,臻使光敏三極管飽和導通。在R6上得到大于1V的脈沖信號,輸入到單片機外部中斷0,喚醒單片機準備接收。0.5s后FSK信號經(jīng)過C3、C4、R1、C2的隔直和衰減,輸入到FSK接收器SM8220P的差分輸入端TIP和RING腳,將FSK信號讀取解調(diào)后從DOUT腳輸出ASCII碼的串行序列,由P87LPC764單片機接收處理,提取出相應(yīng)的電話FSK信息,發(fā)到多功能LED顯示模塊MAX7219驅(qū)動數(shù)碼顯示和24C64保存。
4FSK信息接收通信軟件設(shè)計
單片機對SM8220P輸出的ASCII碼串行序列的識別過程,由接收和數(shù)據(jù)整合兩部分組成。由于FSK信號波特率為1200bps,每發(fā)1位的時間是833us,因此,可以設(shè)定定時器每833us接收1位,每10位提取出1個數(shù)字。如此反復(fù)循環(huán),直到接收完全FSK信息。當有電話來時,在第一聲振鈴后,單片機開始準備檢測接收信號,SM8220P開始接收300個由0、1組成的頻率為1200Hz的信道占用信號和180個“1”標志信號,緊接著接收主叫號碼和時間。每收到1個數(shù)字,SM8220P都把它變換成10位(1PXXXXXXXX0)的串行序列,由13腳輸出傳送給P87LPC764單片機,P87LPC764經(jīng)過精確的定時編程將其檢測整合出相應(yīng)的FSK號碼、時間等數(shù)據(jù),完成FSK信息解碼、接收通信、接收到的電話號碼可以保存在24C64串行E2PROM中,也可以輸出到LCD上顯示。SM8220P的11腳用來提示電話線上是否有新的FSK信息的輸入。若有新的FSK信息輸入,此引腳將產(chǎn)生低電平。單片機接收FSK主叫信息可以采用定時中斷方式,也可以采用延時查詢的辦法進行。電話FSK信息接收通信程序流程如圖4所示。
數(shù)據(jù)挖掘技術(shù)在企業(yè)的信息化建設(shè)中所擔任的角色是實現(xiàn)數(shù)據(jù)信息到商業(yè)知識的轉(zhuǎn)化。首先需要明確數(shù)據(jù)挖掘技術(shù)的處理對象,明白商業(yè)活動的主題;其次,需要對商業(yè)的主題進行分析,并搜集與之相關(guān)的數(shù)據(jù)利用各種技術(shù)對數(shù)據(jù)進行整理分析,并載入適合的數(shù)據(jù)挖據(jù)的算法中,建立模型,再從模型中提取出有用的商業(yè)信息,再根據(jù)分析所得結(jié)果調(diào)整算法,以數(shù)據(jù)和信息的可靠性為依據(jù)對結(jié)果進行判斷;再次,將獲得的商業(yè)知識融合到企業(yè)的信息平臺,利用人機界面對企業(yè)的決策活動予以支持。另外值得注意的是,由于數(shù)據(jù)挖據(jù)技術(shù)屬于高層次的技術(shù),又關(guān)系到企業(yè)的業(yè)務(wù)機密,因此,需要極為專業(yè)的技術(shù)人才專業(yè)管理。
2如何實現(xiàn)數(shù)據(jù)挖掘在企業(yè)的信息化建設(shè)中的應(yīng)用
在企業(yè)進行業(yè)務(wù)的操作過程中往往會產(chǎn)生大量需要處理的數(shù)據(jù),這就為數(shù)據(jù)挖掘的應(yīng)用提出了要求,數(shù)據(jù)挖掘的運用使企業(yè)的大量的數(shù)據(jù)得到了梳理,分析信息的能力提高,在企業(yè)今后的市場開拓記憶日常的運行中發(fā)揮了重要的作用,促進企業(yè)的競爭力的提高,那么,數(shù)據(jù)挖據(jù)具體在企業(yè)的信息化建設(shè)中如何應(yīng)用呢,下文將予以介紹。
2.1利用數(shù)據(jù)挖掘技術(shù)實現(xiàn)客戶信息的有效管理具體來說就是通過對客戶信息進行分析,為客戶建立一個合適的購物模式,以滿足客戶的需求為重,這是處理好企業(yè)與客戶之間的關(guān)系的關(guān)鍵。有相關(guān)數(shù)據(jù)顯示,企業(yè)在獲得一個新的客戶過程中所花費的成本比維系一個老客戶的成本高出6倍-9倍之多,一個老客戶的流失是以10個新客戶的獲得為代價的,由此可見,對于企業(yè)來說老客戶的維護工作至關(guān)重要。通過數(shù)據(jù)挖掘技術(shù)可以得到老客戶的大量的信息,并對其交易記錄、統(tǒng)計信息進行分析后,可以有目的性的對流失的客戶進行分析,找出客戶流失的原因并為新客戶的建立提供模型和經(jīng)驗,有效地對意向客戶和流失客戶進行判斷,起到企業(yè)與客戶的關(guān)系的改善的作用。
2.2利用數(shù)據(jù)挖掘技術(shù)進行市場營銷的分析與管理在市場營銷中,數(shù)據(jù)挖掘的作用在于可以促進市場的分工,以“客戶過去的消費行為可以說明今后的消費傾向”為假設(shè),然后對客戶的信息進行分析,確定某一群體客戶的消費興趣,消費的趨向于需要,進而對消費者的下一次或者下一步的消費行為作出判斷,然后再以此為基礎(chǔ),將識別出來的客戶作為一個消費群體,以此制定營銷計劃,這與傳統(tǒng)的不以消費者的實際需求為參考而進行大規(guī)模營銷的手段相比較,在成本的節(jié)約方面貢獻極大,可以帶給企業(yè)更多的利潤。在市場營銷中的應(yīng)用上,各種數(shù)據(jù)挖掘算法都得到了廣泛的應(yīng)用,每種不同的操作手段都可以引導商家做出滿足消費者需求的決策與判斷。
3結(jié)束語
近年來,隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,大數(shù)據(jù)越來越受到關(guān)注,其應(yīng)用逐步滲透至多個行業(yè),開啟了全新的數(shù)據(jù)時代。數(shù)據(jù)是征信業(yè)務(wù)開展的基礎(chǔ)資料,征信活動主要是圍繞數(shù)據(jù)進行采集、整理、保存、加工,并最終向信息使用者提供。大數(shù)據(jù)不僅為征信業(yè)發(fā)展提供了極為豐富的數(shù)據(jù)信息資源,也改變了征信產(chǎn)品設(shè)計和生產(chǎn)理念,成為了未來征信業(yè)發(fā)展最重要的基石。我國征信業(yè)發(fā)展尚處于起步階段,在大數(shù)據(jù)時代存在征信法律制度和業(yè)務(wù)規(guī)則不夠完善、征信機構(gòu)數(shù)據(jù)處理能力有待提高等問題。未來征信業(yè)面臨的機遇和挑戰(zhàn)并存,研究大數(shù)據(jù)時代征信業(yè)的發(fā)展具有重要意義。
大數(shù)據(jù)時代征信業(yè)面臨的機遇和挑戰(zhàn)
目前,對大數(shù)據(jù)無公認的定義,一般認為大數(shù)據(jù)是指所涉及的資料量規(guī)模巨大到無法通過目前主流軟件工具,在合理時間內(nèi)達到擷取、管理、處理、并整理成為服務(wù)于經(jīng)營決策的資訊。大數(shù)據(jù)的出現(xiàn),使征信業(yè)發(fā)展面臨的外部環(huán)境發(fā)生了巨大的變化。
(一)大數(shù)據(jù)時代征信業(yè)面臨的機遇。
1.優(yōu)化征信市場的格局。
隨著征信機構(gòu)市場化運營機制的確立,將會有更多信息資源優(yōu)勢的企業(yè)借助互聯(lián)網(wǎng)、大數(shù)據(jù)等信息技術(shù)的創(chuàng)新進步,從征信業(yè)薄弱環(huán)節(jié)切入,通過服務(wù)創(chuàng)新或產(chǎn)品創(chuàng)新打破原有的征信市場格局。一是電商企業(yè)將組建征信機構(gòu)。以阿里巴巴為例,其利用淘寶、天貓、支付寶平臺上的行為數(shù)據(jù)和信用情況,建立成了涵蓋數(shù)十萬企業(yè)的數(shù)據(jù)庫,具備了開展網(wǎng)絡(luò)征信服務(wù)的基礎(chǔ)和實力。二是金融機構(gòu)建立征信機構(gòu)。例如平安集團擬整合網(wǎng)貸信息、銀行信貸信息、車輛違章信息等,建立金融數(shù)據(jù)挖掘中介機構(gòu)。三是新型征信機構(gòu)應(yīng)運而生。一些大數(shù)據(jù)公司依靠技術(shù)手段,以電子商務(wù)、社交網(wǎng)絡(luò)為平臺,采集信息,提供信用信息服務(wù),可能成為新型的征信機構(gòu)。
2.推動征信業(yè)的轉(zhuǎn)型升級。
大數(shù)據(jù)給征信業(yè)帶來轉(zhuǎn)型升級的歷史機遇,未來的征信業(yè)將以智能數(shù)據(jù)分析系統(tǒng)為平臺,利用大數(shù)據(jù)挖掘技術(shù),支持征信業(yè)發(fā)展創(chuàng)新。大數(shù)據(jù)支持征信業(yè)升級和轉(zhuǎn)型主要體現(xiàn)在二個方面。一方面大數(shù)據(jù)促成征信業(yè)建立全新的風險控制體制,向有效監(jiān)管轉(zhuǎn)型。大數(shù)據(jù)技術(shù)對客戶信用信息進行深度挖掘,實時監(jiān)控,防范潛在的信用風險。另一方面大數(shù)據(jù)支持征信機構(gòu)向精細化管理轉(zhuǎn)變。大數(shù)據(jù)的核心優(yōu)勢在于信息挖掘,精細化管理的首要條件是充分信息化,包括業(yè)務(wù)信息化和管理信息化。
3.促進征信業(yè)差異化競爭。
征信機構(gòu)通過采用不同的數(shù)據(jù)來源,不同的數(shù)據(jù)處理方式,針對不同的客戶,開發(fā)出不同的產(chǎn)品,滿足不同層次客戶的市場需求,實現(xiàn)差異化競爭。例如,金融機構(gòu)對征信服務(wù)的需求將從單個借款主體的信用報告,擴展到運用信用信息拓展網(wǎng)絡(luò)影響和金融服務(wù)渠道。P2P網(wǎng)絡(luò)借貸、電商金融等業(yè)態(tài)需要借助信用信息共享防范風險,降低交易成本。
4.拓展征信數(shù)據(jù)來源。
大數(shù)據(jù)使征信數(shù)據(jù)來源呈現(xiàn)多元化、多層化和非結(jié)構(gòu)化的特點,更加全面和真實地反映信息主體的信用情況。征信機構(gòu)從在政府部門、金融機構(gòu)等實體機構(gòu)中采集信息,轉(zhuǎn)向從互聯(lián)網(wǎng)等虛擬世界中獲取信息。在數(shù)據(jù)采集的廣度和深度上,征信數(shù)據(jù)量將激增,采集包括證券數(shù)據(jù)、保險數(shù)據(jù)、商業(yè)信用數(shù)據(jù)、消費交易數(shù)據(jù)和公共事業(yè)繳費數(shù)據(jù)等,全面地覆蓋與信息主體相關(guān)的各項因素。
(二)大數(shù)據(jù)時代征信業(yè)面臨的挑戰(zhàn)。
1.現(xiàn)有征信業(yè)務(wù)規(guī)則與大數(shù)據(jù)時代不匹配。我國有關(guān)征信業(yè)的法律法規(guī)的規(guī)制對象主要是傳統(tǒng)金融領(lǐng)域,《征信業(yè)管理條例》及其配套制度初步構(gòu)建了我國征信業(yè)的法律法規(guī)框架,但是《征信業(yè)管理條例》是否滿足大數(shù)據(jù)時代征信業(yè)務(wù)的規(guī)則要求,尚未得到市場驗證。目前,缺少對大數(shù)據(jù)時代征信活動的規(guī)范,如有關(guān)大數(shù)據(jù)采集、整理、保存、加工和處理的制度要求。因此,還需要進一步細化和完善征信業(yè)務(wù)規(guī)則,以更好促進大數(shù)據(jù)時代征信市場的發(fā)展。
2.征信業(yè)監(jiān)管技術(shù)和水平需改進。大數(shù)據(jù)時代給征信業(yè)發(fā)展帶來深刻影響,同時也對征信業(yè)監(jiān)管提出了更高的要求。要適應(yīng)大數(shù)據(jù)時代的征信監(jiān)管需求,征信監(jiān)管水平要能跟上大數(shù)據(jù)征信的發(fā)展水平,監(jiān)管政策要符合大數(shù)據(jù)的基本規(guī)律,監(jiān)管人員要具有適應(yīng)大數(shù)據(jù)的知識和能力。在行業(yè)自律監(jiān)管方面,我國行業(yè)監(jiān)管尚未發(fā)育成熟,行業(yè)標準尚未統(tǒng)一,行業(yè)規(guī)范以及行業(yè)職業(yè)道德等內(nèi)容尚未完善。
3.信息安全和隱私保護形勢嚴峻。隨著數(shù)據(jù)的進一步集中和數(shù)據(jù)量的急劇增長,對海量數(shù)據(jù)進行安全防護變得更加困難,數(shù)據(jù)的分布式處理也加大了數(shù)據(jù)泄露的風險,隱私保護和數(shù)據(jù)安全成為制約大數(shù)據(jù)發(fā)展的瓶頸。大數(shù)據(jù)時代下的征信業(yè)同時具有了大數(shù)據(jù)和征信兩個特性,對隱私保護和數(shù)據(jù)安全的要求更高。
4.數(shù)據(jù)處理能力亟待提高。如何有效處理大數(shù)據(jù),是大數(shù)據(jù)發(fā)揮作用的重要環(huán)節(jié)。益百利等大型征信機構(gòu)在數(shù)據(jù)處理方面已經(jīng)采取多層次數(shù)據(jù)挖掘等先進技術(shù),利用私有云平臺,對系統(tǒng)中海量數(shù)據(jù)進行處理和研發(fā),減少主觀判斷,提高風險預(yù)測的準確性。但是目前我國征信機構(gòu)發(fā)展起步較晚,缺少對數(shù)據(jù)處理的核心技術(shù),導致數(shù)據(jù)分析結(jié)果不能夠準確的識別個體或組織的行為。
5.硬件基礎(chǔ)設(shè)施需要全面升級。過去征信機構(gòu)存儲征信數(shù)據(jù)主要是在本地建立數(shù)據(jù)庫,大數(shù)據(jù)時代隨著數(shù)據(jù)量呈幾何級數(shù)的增加,征信機構(gòu)硬件技術(shù)的發(fā)展已經(jīng)跟不上數(shù)據(jù)容量的增長速度,數(shù)據(jù)存儲面臨較大壓力。
大數(shù)據(jù)時代征信業(yè)發(fā)展的措施與建議
隨著大數(shù)據(jù)時代的到來,未來征信業(yè)發(fā)展要從制度設(shè)計、技術(shù)進步、信息共享、監(jiān)督管理、隱私保護等方面不斷創(chuàng)新,促進征信業(yè)在大數(shù)據(jù)背景下的跨越式發(fā)展。
(一)建立符合大數(shù)據(jù)的征信法律制度和業(yè)務(wù)規(guī)則體系。現(xiàn)有的征信法律體系都是基于傳統(tǒng)數(shù)據(jù)模式下制定的,難以滿足大數(shù)據(jù)等新技術(shù)條件下征信業(yè)發(fā)展的制度需求。在征信業(yè)務(wù)開展過程中,大數(shù)據(jù)的收集使用可能涉及國家信息安全、企業(yè)商業(yè)秘密、公民隱私等,為了給大數(shù)據(jù)條件下征信業(yè)發(fā)展提供制度保障,需要從征信立法層面完善信息安全和數(shù)據(jù)管理的法律制度,明確大數(shù)據(jù)背景下數(shù)據(jù)采集、整理、加工、分析、使用的規(guī)則,確保大數(shù)據(jù)時代征信業(yè)發(fā)展有法可依。
(二)加強征信產(chǎn)品創(chuàng)新。隨著可獲得的數(shù)據(jù)量呈幾何倍數(shù)的增加,征信機構(gòu)通過深度挖掘和使用這些數(shù)據(jù),就可以極大地拓展征信產(chǎn)品的種類,不僅能夠提供信用報告查詢等基礎(chǔ)服務(wù)和產(chǎn)品,還可以提供其他綜合性產(chǎn)品,滿足社會各界的需求。從征信產(chǎn)品的滿足層次高低的不同,可以分為宏觀、中觀和微觀的征信產(chǎn)品。宏觀層面,征信機構(gòu)通過大數(shù)據(jù)分析可以對系統(tǒng)性、全局性的風險信息進行預(yù)測。中觀層面,征信機構(gòu)的海量數(shù)據(jù)包含大量時效性和政策含義都很強的信息,可以靈活多樣地進行多維度組合分析。把這些信息整理和挖掘出來,建立對應(yīng)的指數(shù)體系,有助于行業(yè)監(jiān)管。微觀層面,在信用主體(包括企業(yè)和個人)同意的前提下,征信機構(gòu)可以提供每一個信用主體的信用報告、信用評分、身份驗證、欺詐檢測、風險預(yù)警、關(guān)聯(lián)分析等多種數(shù)據(jù)服務(wù)。
(三)提高大數(shù)據(jù)技術(shù)處理能力。大數(shù)據(jù)價值的完整體現(xiàn)需要多種技術(shù)的協(xié)同。數(shù)據(jù)抽取與集成、數(shù)據(jù)分析以及數(shù)據(jù)解釋,是大數(shù)據(jù)時代征信數(shù)據(jù)處理的三個重要環(huán)節(jié),在數(shù)據(jù)處理過程中搜索引擎、云計算、數(shù)據(jù)挖掘等新技術(shù)使用必不可少。因此,征信機構(gòu)要加大數(shù)據(jù)處理分析專業(yè)人才隊伍的培養(yǎng),同時要引進大數(shù)據(jù)處理的專業(yè)方法和工具,建立前瞻性的征信業(yè)務(wù)分析模型,更好的把握、預(yù)測市場和信息主體的行為。
(四)健全大數(shù)據(jù)信息共享機制。完善的大數(shù)據(jù)標準體系是推進數(shù)據(jù)共建共享的前提。目前,我國來自各行業(yè)、各渠道的數(shù)據(jù)標準存在差異,成為阻礙數(shù)據(jù)開放和共享的關(guān)鍵瓶頸。建議盡快統(tǒng)一標準和格式,以便進行規(guī)范化的數(shù)據(jù)融合,提升大數(shù)據(jù)的整合能力,打破資源部門間的信息孤島,從而完善信息共享機制。
一、對稅務(wù)數(shù)據(jù)深度利用的理解
長期以來,稅收工作中數(shù)據(jù)利用比較常見的形式有:報表瀏覽、簡單查詢、復(fù)雜查詢、稅源分析、稅負分析、收入預(yù)測、過程監(jiān)控等,多數(shù)專家認為,目前稅務(wù)數(shù)據(jù)應(yīng)用的一般特征是基于匯總、分類、簡單計算基礎(chǔ)之上的原始稅收數(shù)據(jù)的“復(fù)制式”展現(xiàn)和對稅收現(xiàn)象的“陳列式”描述。
隨著經(jīng)濟、社會的發(fā)展,稅收數(shù)據(jù)的般利用已經(jīng)不能滿足稅收信息化深化和稅收管理現(xiàn)代化的內(nèi)在需求,為了加強稅收征管、規(guī)范稅收秩序,國務(wù)院于1994年開始實施“金稅工程”?!敖鸲惞こ獭背跗谝浴霸鲋刀惐O(jiān)管”為主要目標;二期時,內(nèi)容已拓寬為增值稅防偽稅控開票系統(tǒng)、防偽稅控認證系統(tǒng)、增值稅計算機交叉稽核系統(tǒng)、發(fā)票協(xié)查信息管理系統(tǒng)的四個系統(tǒng);到了三期,其目標已經(jīng)成為:在二期基礎(chǔ)上,建立七個子系統(tǒng)(管理子系統(tǒng)、征收子系統(tǒng)、稽查子系統(tǒng)、處罰子系統(tǒng)、執(zhí)行子系統(tǒng)、救濟子系統(tǒng)、監(jiān)控子系統(tǒng)),35個模塊。依據(jù)美國學者Richard.L-Nolan的理論(對于任何行業(yè),信息化大體要經(jīng)歷初始、蔓延、控制、集成、數(shù)據(jù)管理和成熟這樣幾個發(fā)展階段,這是信息化發(fā)展的般規(guī)律。)和Mische的補充(他認為集成和數(shù)據(jù)管理是密不可分的,因此信息化發(fā)展的必然路徑是起步、增長、成熟和更新四個階段),目前,稅務(wù)信息化的發(fā)展階段已開始向成熟階段過渡。于是稅收數(shù)據(jù)的深度利用便提上日程。我們可以從稅收管理戰(zhàn)略和稅收政策分析兩方面來看這種需求的提出。
從稅務(wù)管理戰(zhàn)略來看,在納稅前如何綜合評價簡化管理制度(法律)及照章納稅宣傳的相對效果;在納稅中如何核算稅收結(jié)構(gòu)和管理程度的實際資源成本(管理、照章納稅、效率、逃稅),以及納稅后對稅收差距的衡量(包括潛在稅收與申報稅收的差距、申報稅收與實收稅收的差距、實收稅收與送達國庫稅收的差距),都涉及到稅收數(shù)據(jù)的深度利用問題。
從稅收政策分析的角度來看,稅收經(jīng)濟的和諧發(fā)展度量、稅制改革方案分析、稅收減免和優(yōu)惠的成本和政策收益、稅收政策的經(jīng)濟影響等等也涉及到稅收數(shù)據(jù)的深度利用和挖掘問題。
這些問題都從以下兩方面引發(fā)了我們對稅務(wù)數(shù)據(jù)深度利用的理解和思考:一方面提出了我們需要全面檢視擁有的稅務(wù)數(shù)據(jù)信息的需求。在各國稅務(wù)數(shù)據(jù)信息深度利用的經(jīng)驗當中,提出過一些全面檢視的標準,例如按照稅基到稅收收入的實現(xiàn)途徑,可以檢視:稅基的規(guī)模,包括真實稅基和潛在稅基;稅收管理資源使用方向的詳細分類;管理資源使用的效用;稅收管理的效果,例如收到稅款的多少,處理案件的數(shù)量等。
另一方面,更為關(guān)鍵的是,提出了如何科學利用、深度利用的問題??偨Y(jié)以上兩方面,我們認為稅收數(shù)據(jù)的深度利用是指:在數(shù)據(jù)集中和系統(tǒng)整合的基礎(chǔ)上,建立全面的稅務(wù)數(shù)據(jù)信息,既包括稅務(wù)系統(tǒng)內(nèi)部數(shù)據(jù),也包括其他政府部門、企業(yè)、居民等外部數(shù)據(jù),并且進一步在各種模型的幫助下,發(fā)現(xiàn)數(shù)據(jù)的內(nèi)在規(guī)律。就目前而言,重點任務(wù)是在稅務(wù)管理方面提出適用中國實踐的模型并且應(yīng)用,同時初步探索在稅收經(jīng)濟方面能夠刻畫符合我國國情的模型。
二、構(gòu)建模型是數(shù)據(jù)深度利用的切入口
如前所述,稅務(wù)數(shù)據(jù)深度利用和挖掘的關(guān)鍵在于模型的應(yīng)用,下面我們就來討論模型是什么?我們?yōu)槭裁葱枰P?我們需要什么樣的模型?就稅收數(shù)據(jù)深度利用的模型而言,大致可以分為兩類:以科學化管理、定量化管理、精細化管理為內(nèi)在思想的管理工具和手段所形成的模型;以研究稅收經(jīng)濟關(guān)系協(xié)調(diào)發(fā)展為目的的稅收經(jīng)濟模型。
在基本認識了稅務(wù)數(shù)據(jù)深度利用中的模型是什么之后,雖然我們達成了一種共識,我們需要模型,但是如果我們思考過為什么需要模型?顯然會對模型應(yīng)用更能得心應(yīng)手。我們認為模型所發(fā)揮的作用無外乎以下三種:
首先,刻畫稅收經(jīng)濟關(guān)系。一般而言,我們經(jīng)常提到的是模型在刻畫稅收經(jīng)濟關(guān)系當中所起的作用,即采用代數(shù)形式的定量分析將稅收經(jīng)濟理論模型化,然后適當根據(jù)實踐情況把理論模型予以修正,并將相關(guān)數(shù)據(jù)應(yīng)用到修正模型中,對模型結(jié)果進行經(jīng)驗分析。這種利用的過程是階段性的,是從初級到高級的過程,是一個水平不斷提高、效果不斷改進的發(fā)展過程。
其次,歸納稅收管理實踐。模型起到的作用是將復(fù)雜的稅收征納活動通過數(shù)字化的形式總結(jié)歸納,將稅收征納的每一個過程精細化、每一個結(jié)果數(shù)據(jù)化,并且建立起投入到產(chǎn)出之間的對應(yīng)關(guān)系。最后,數(shù)據(jù)組織的導向性作用。這種導向性作用的發(fā)揮是通過模型應(yīng)用過程當中對各類數(shù)據(jù)提出的要求實現(xiàn)的,通過該作用,隨著時間的發(fā)展,數(shù)據(jù)集中的有效性與目的性不斷加強,反之,模型應(yīng)用空間不斷擴展。在這一方面,美國個人所得稅模型應(yīng)用為我們提供了很好的啟迪。
結(jié)合目前的稅務(wù)數(shù)據(jù)基礎(chǔ)及其發(fā)展趨勢來看,金稅三期將成為稅收數(shù)據(jù)深度利用的良好契機,構(gòu)建相應(yīng)模型是我們形成稅務(wù)數(shù)據(jù)深度利用良好局面的切入口。
對于“我們需要什么樣的模型”的回答,是一個不斷結(jié)合實際進行摸索的過程,但是就現(xiàn)階段而言,從可操作性的角度出發(fā),我們還是需要給所應(yīng)用的模型框定一個邊界:數(shù)據(jù)可利用性,如果沒有數(shù)據(jù)的支持,模型應(yīng)用將無從談起;可計算性,模型應(yīng)用迅速發(fā)展的基石之一就是現(xiàn)代計算技術(shù)的發(fā)展,沒有計算工具的支持,具有龐大計算量的各種稅收模型的完成無法想象,支持稅收模型應(yīng)用的計算工具包括硬件具備的計算能力和軟件具有的算法能力兩種。
三、數(shù)據(jù)深度利用平臺建設(shè)的體厶
數(shù)據(jù)深度利用和挖掘最終必須落實到具體計算平臺上,否則縱然有大量的數(shù)據(jù)積累,仍然擺脫不了研究與實踐部門脫節(jié)的窘態(tài)。雖然目前我們擁有大量的計算軟件平臺,然而,總感覺到這些應(yīng)用平臺離我們的實際需要有一定距離。
目前我們正在參與完成一個國家自然科學基金研究項目:稅收政策分析模型支持系統(tǒng)的實現(xiàn)及其在稅制改革中的應(yīng)用研究,其主要內(nèi)容和實質(zhì)就是探索構(gòu)建一個有利干數(shù)據(jù)深度利用的計算平臺。從該平臺的構(gòu)建來看,有幾點體會:首先,平臺的構(gòu)建必須結(jié)合具體的研究問題展開。通用性的平臺雖然很好,但是由于前面所提到的數(shù)據(jù)可利用性和可計算性的原因,加上實際工作的緊迫性需求,往往使得通用性平臺的規(guī)劃會落空,甚至于進一步影響數(shù)據(jù)深度利用工作本身。在該問題上,我們的平臺研究就結(jié)合了增值稅轉(zhuǎn)型的測算問題,利用了CGE平臺進行實證性的應(yīng)用。
其次,考慮針對具體問題研究的通用性拓展。雖然實用為先,然而要做到持續(xù)性的數(shù)據(jù)利用,必然要考慮拓展的問題。在這個問題上,我們的平臺通過稅制表示方法、稅收政策分析模型描述語言中國稅收政策分析模型支持系統(tǒng)等方法進行嘗試。
更為重要的是,對適合中國國情的稅收經(jīng)濟模型的提出。由于長期以來的數(shù)據(jù)缺少原因,在我國模型建設(shè)方面沒有進一步的探索。這種缺陷在海量的數(shù)據(jù)突然呈現(xiàn)在我們面前的時候更加突出。我們正在嘗試提出適用干中國的稅收經(jīng)濟模型,雖然肯定會比較艱難,但是這是一條必經(jīng)之路。
當前“大數(shù)據(jù)技術(shù)”充滿了新的機遇和挑戰(zhàn),其在企業(yè)IT基礎(chǔ)架構(gòu)、數(shù)據(jù)管理、分析和服務(wù)這些關(guān)鍵規(guī)劃領(lǐng)域的應(yīng)用,將會對社會經(jīng)濟發(fā)展帶來長遠深刻的影響。大數(shù)據(jù)指的是從各種各樣的數(shù)據(jù)中快速獲得有價值信息的能力,具有數(shù)據(jù)量大、種類繁多、價值稀疏、處理速度快的特征,這些特征對目前社會各個行業(yè)的信息架構(gòu)、系統(tǒng)的沖擊非常大。大數(shù)據(jù)技術(shù)對整個社會經(jīng)濟發(fā)展來說既是機遇也是挑戰(zhàn)。
(一)必要性
根據(jù)IDC在2011年6月的《數(shù)字宇宙》(DigitalUniverse)研究報告,2011年全球新建和復(fù)制的信息量超過1.9ZB(1.8萬億GB),五年時間增加了近九倍。隨著數(shù)據(jù)量的指數(shù)級增長、數(shù)據(jù)源種類(包括結(jié)構(gòu)化數(shù)據(jù)源和非結(jié)構(gòu)化數(shù)據(jù)源,如社交媒體、富媒體文件以及地理空間信息)的飛速增加,以及數(shù)據(jù)產(chǎn)生速度的加快(如實時傳感器數(shù)據(jù)),傳統(tǒng)的數(shù)據(jù)庫和架構(gòu)無法處理、管理和分析如此龐大的數(shù)據(jù)集。政府、金融、電信、互聯(lián)網(wǎng)等大數(shù)據(jù)應(yīng)用的行業(yè)先鋒目前均面臨大數(shù)據(jù)的問題。不僅如此,隨著物聯(lián)網(wǎng)、云計算、移動互聯(lián)網(wǎng)、車聯(lián)網(wǎng)、智能手機、平板電腦的飛速發(fā)展,大數(shù)據(jù)技術(shù)擁有了更為廣泛的數(shù)據(jù)資源。因此,IT產(chǎn)業(yè)界及行業(yè)用戶都亟需針對大數(shù)據(jù)設(shè)計和優(yōu)化大數(shù)據(jù)存儲、管理和查詢平臺,來替代傳統(tǒng)關(guān)系型數(shù)據(jù)庫平臺。在技術(shù)發(fā)展的前沿階段進行實驗平臺建設(shè)對我學院師生具有重要意義。該實驗平臺能夠為學生提供一個了解最前沿技術(shù)的機會,不僅能夠提高學生學習興趣、自學能力,還為學生就業(yè)、更好地規(guī)劃未來的職業(yè)發(fā)展提供了機會。大數(shù)據(jù)技術(shù)的機遇與挑戰(zhàn)帶來了很大的人才缺口,目前大數(shù)據(jù)技術(shù)平臺開發(fā)、方案實施人才緊缺;由于云存儲、大數(shù)據(jù)技術(shù)帶來的信息安全問題,也亟需大量信息安全領(lǐng)域的人才;由于大數(shù)據(jù)技術(shù)在物聯(lián)網(wǎng)、電子商務(wù)、移動互聯(lián)方面的應(yīng)用,對了解大數(shù)據(jù)技術(shù)的電子商務(wù)專業(yè)人才也更青睞。通過本實驗平臺的培養(yǎng),感興趣的優(yōu)秀學生還可以嘗試考取與大數(shù)據(jù)技術(shù)密切相關(guān)的Hadoop專業(yè)認證———ClouderaCertifiedDeveloper/AdministratorforApacheHadoop,為學校、學院在該領(lǐng)域帶來正面影響,增加更多合作和就業(yè)的機會。該實驗平臺能夠為信息系統(tǒng)專業(yè)試點班培養(yǎng)計劃的很多核心課程(包括管理統(tǒng)計學中的業(yè)務(wù)報表與分析、商務(wù)智能方法與應(yīng)用、商務(wù)智能實踐、數(shù)據(jù)挖掘和BA綜合實訓等)形成較好的前后銜接關(guān)系,能夠豐富實踐教學環(huán)節(jié),深化教學大綱的內(nèi)容,從建設(shè)更合理的課程建設(shè)體系來說具有很大的必要性。近幾年學生就業(yè)壓力越來越大,迫切需要對教學內(nèi)容和實踐環(huán)節(jié)不斷突破創(chuàng)新,才能具備持續(xù)發(fā)展能力。因此在原有課程體系和實踐教學環(huán)境的基礎(chǔ)上增設(shè)本實驗平臺非常必要。
(二)可行性
教學計劃中的相關(guān)程序設(shè)計課程為學生學習云存儲技術(shù)、熟悉大數(shù)據(jù)開發(fā)平臺、了解最新大數(shù)據(jù)技術(shù)的發(fā)展、進行大數(shù)據(jù)平臺基礎(chǔ)上的開發(fā)、實現(xiàn)對大數(shù)據(jù)的分析、可視化演示打好了基礎(chǔ)。英特爾ApacheHadoop平臺是目前大多數(shù)大數(shù)據(jù)處理的技術(shù)基礎(chǔ),目前該技術(shù)已經(jīng)發(fā)展成熟,并隨之產(chǎn)生很多基于該平臺的大數(shù)據(jù)處理工具,可供實驗室建設(shè)實驗平臺使用。
二、建立大數(shù)據(jù)實驗平臺的基本構(gòu)想
(一)實驗平臺人員
實驗平臺人員負責實驗平臺的建設(shè)、維護,實驗設(shè)計與指導人員由在大數(shù)據(jù)相關(guān)領(lǐng)域、課程建設(shè)以及實踐教學方面都有著豐富的經(jīng)驗的教師與實驗室工作人員構(gòu)成,同時與大數(shù)據(jù)企業(yè)進行合作,獲得其核心技術(shù)人員的支持、培訓和大力配合,可以共同組成一個經(jīng)驗豐富、精煉實干的建設(shè)團隊。
(二)軟件調(diào)研
大數(shù)據(jù)的特點為4個“V”:第一,“Volume”,指的數(shù)據(jù)量大,包括大的數(shù)據(jù)塊,或數(shù)據(jù)總量巨大,從TB躍升到PB;第二,“Variety”,指的是數(shù)據(jù)種類繁多,包含大量非結(jié)構(gòu)化數(shù)據(jù),例如網(wǎng)絡(luò)日志、音頻、視頻、地理信息等;第三,“Value”,價值稀疏性,大量數(shù)據(jù)中有價值數(shù)據(jù)很少;第四,“Velocity”,指的是處理速度快,這與傳統(tǒng)數(shù)據(jù)挖掘有很大區(qū)別。選擇有數(shù)據(jù)分析基礎(chǔ)、在業(yè)內(nèi)發(fā)展領(lǐng)先的企業(yè)進行調(diào)研并選擇適合高校規(guī)模的合作企業(yè)是建立實驗平臺的重要工作。很多公司給出了可供使用的大數(shù)據(jù)平臺:IBM誖InfoSphere誖BigInsightsTMBasicEdition是一款基于開放源碼ApacheHadoop的分析平臺,用于分析大量本機格式的非常規(guī)數(shù)據(jù),支持結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化內(nèi)容,以實現(xiàn)最大程度的靈活性;IBM誖InfoSphere誖Streams是一個高級計算平臺,幫助用戶開發(fā)的應(yīng)用程序快速攝取、分析和關(guān)聯(lián)來自數(shù)千個實時源的信息;惠普公司Vertica分析平臺6.1,能夠通過Hadoop分布式文件系統(tǒng)連接器來優(yōu)化大數(shù)據(jù);ClearStoryData大數(shù)據(jù)分析新創(chuàng)公司,通過Clearstory,公司客戶可以將自身的數(shù)據(jù)與行業(yè)的公共數(shù)據(jù)融合,尋找統(tǒng)計上的新視角,目標是取代目前市場上的主流數(shù)據(jù)可視化工具,包括QlikView和Tableau等老牌工具;Informatica9.1提供首款Hadoop編譯器Hparse,這是一種針對Hadoop而優(yōu)化的數(shù)據(jù)轉(zhuǎn)換環(huán)境,該軟件支持靈活高效地處理Hadoop里面的任何文件格式,為Hadoop開發(fā)人員提供了即開即用的解析功能,以便處理復(fù)雜而多樣的數(shù)據(jù)源;Datameer:Hadoop海量數(shù)據(jù)分析平臺允許用戶在缺乏技術(shù)知識的情況下能夠分析大量數(shù)據(jù);Infochimps平臺以其完備的基礎(chǔ)設(shè)施和專業(yè)知識,為客戶提供端到端的大數(shù)據(jù)解決方案,Infochimps是一家位于美國德克薩斯州奧斯丁的創(chuàng)業(yè)公司,2012年2月從數(shù)據(jù)市場轉(zhuǎn)型為大數(shù)據(jù)平臺提供商后獲得谷歌投資;甲骨文大數(shù)據(jù)機———OracleBigDataAppliance集成系統(tǒng)融入了Cloudera的DistributionIncludingApacheHadoop、ClouderaManager和一個開源R;微軟SQLServer新增PDW功能,可以幫助客戶擴展部屬數(shù)百TB級別數(shù)據(jù)的分析解決方案;亞馬遜將MapReduce作為一項服務(wù),其彈性MapReduce編程是一項能夠迅速擴展的Web服務(wù),運行在aws的亞馬遜彈性計算云和亞馬遜簡單存儲服務(wù)上;Teradata是企業(yè)級數(shù)據(jù)倉庫(EDW)的領(lǐng)導者,在結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和大部分非結(jié)構(gòu)化數(shù)據(jù)領(lǐng)域幾乎沒有很大成果,因此收購了AsterDa-ta———一家提供SQL-MapReduce框架的公司。AsterData是高級分析和管理各種非結(jié)構(gòu)化數(shù)據(jù)領(lǐng)域的市場領(lǐng)導者和開拓者,為Teradata帶來了大數(shù)據(jù)分析市場商機。
(三)方案實施
實驗平臺的設(shè)計同時立足于大數(shù)據(jù)技術(shù)的發(fā)展的前沿性與本學院學生專業(yè)特點,與學生前序的理論、實踐課程均有良好的銜接,符合人才培養(yǎng)計劃,深化了教學大綱的內(nèi)容,并針對不同專業(yè)學生設(shè)計實踐學時、內(nèi)容和難度。本實驗平臺可以同大數(shù)據(jù)行業(yè)中的公司科研部門共同合作建設(shè),雙方確定在人才培養(yǎng)、師資培訓、共建實驗室和實訓基地、推動大學生校外實習和社會實踐活動的開展等方面開展全面、廣泛、長期、深入的合作。該實驗室建設(shè)將豐富實踐教學體系,也可推動學院科研項目立項、新課題研究、專項基金申請和聯(lián)合開展商用項目開發(fā)等;該實驗室使師生能接觸高新大數(shù)據(jù)開發(fā)平臺,了解最新大數(shù)據(jù)技術(shù)的發(fā)展,進行大數(shù)據(jù)平臺的開發(fā),實現(xiàn)對大數(shù)據(jù)的分析、可視化演示,增強學生的動手能力并提升就業(yè)質(zhì)量;與此同時,提升了教師的項目管理能力和教學能力。
三、結(jié)論
1 地方文獻報刊信息數(shù)據(jù)庫
地方文獻是指內(nèi)容上具有地域性,同時具有重復(fù)使用價值的文獻。由于它完整、系統(tǒng)地記錄了特定地域內(nèi)自然和人文方面的各種信息,從而為人們提供了研究特定地域內(nèi)歷史、現(xiàn)代及未來的有關(guān)資料。
地方文獻的類型多種多樣,報刊文獻是其中的一種。它具有信息量大,傳遞周期短,內(nèi)容相對客觀、翔實等特點。但由于它的總量太大,有關(guān)的地方文獻信息分散在不同時期、不同品種的報刊之中。僅靠瀏覽原始文獻,迅速查到有關(guān)資料,幾乎是不可能的。地方文獻報刊索引就是為解決這一問題而編制成的一種檢索工具。
在手工時代,地方文獻報刊索引表現(xiàn)為篇目索引或題錄索引的形式,即將報刊中所載地方文獻篇目按一定順序編排起來,以利讀者查找文章的所在位置。這種索引不反映文章的具體內(nèi)容,只具有指向和示址作用。同時,也對地方事物起著揭示和報道的作用。除了作為一種綜合性的檢索工具外,還可以在這種索引的基礎(chǔ)上編制各種情報報導刊物,或圍繞特定學科及專業(yè)進行定向報導和檢索,以服務(wù)于地方的各項事業(yè)。
鑒于地方文獻報刊索引的重要作用,許多公共圖書館都曾積極編制這種索引。例如,首都圖書館自50年代起開始編制《北京地方文獻報刊資料索引》,涵蓋了本世紀以來的內(nèi)容;甘肅省圖書館也是在同一時期開始編制西北五省的地方文獻報刊索引;長春市圖書館也曾編制了《東北地方文獻索引》等檢索工具。為了避免目錄體系過于龐大,這種卡片式篇目索引一般僅以分類方式編排。因此讀者也只能從分類途徑對報刊上的地方文獻信息進行檢索。 進入計算機時代以來,以數(shù)據(jù)庫形式來處理地方文獻信息已成為圖書館地方文獻工作的必然趨勢。計算機所具有的自動識別與排序功能,使地方文獻信息的編排檢索變得更加方便、更加快捷。通過全文掃描技術(shù)完成的報刊全文數(shù)據(jù)庫,使得報刊上的地方文獻信息得到更充分地揭示和利用。由于計算機具有一次性輸入,多途徑輸出的功能,因而在對地方文獻信息進行存儲與檢索時,增加了篇名、著者、出版、文摘等多方面的途徑。尤其是從主題途徑檢索地方文獻信息的問題得到了很好地解決。
在地方文獻報刊信息數(shù)據(jù)庫(以下簡稱報刊信息庫)中,分類標引和主題標引都是以揭示文獻內(nèi)在特征為目的的標引方法,只是揭示的角度有所不同。由于地方文獻的史料特征極為明顯,故地方文獻的讀者往往是從特定的事件、人物、時間、地域的角度入手進行檢索。因而可以說主題檢索是一種最直接反映地方文獻內(nèi)容特征的檢索途徑,也是建立檢索工具和檢索系統(tǒng)的基礎(chǔ)和前提。近些年來,圖書情報界對有關(guān)主題標引的原則和操作方法有過許多研究和探討,撰寫過很多的著作和文章。但由于地方文獻中連續(xù)出版物本身所具有的特征,其主題標引的原則和方法與其它類型文獻的標引還是有所不同。本文擬從報刊信息數(shù)據(jù)庫的建設(shè)入手,探討有關(guān)地方文獻報刊信息主題標引的一些問題。
2 地方文獻報刊信息數(shù)據(jù)庫中的主題標引
2.1詞表的編制
報刊信息庫與其它類型數(shù)據(jù)庫相比,最突出的特點是要反映地方文獻本身所具有的特征。同時還要滿足地方文獻用戶特殊的檢索需求。因此,選擇一部適合地方文獻特征的主題詞表是開展標引工作的首要問題。
《漢語主題詞表》(以下簡稱漢表)是一部供機檢使用的綜合性基礎(chǔ)型詞表。它所收錄的詞匯可以供各個機構(gòu)和行業(yè)從中選詞,以編制適合本專業(yè)或本機構(gòu)使用的專業(yè)詞表。實際上,我國很多專業(yè)情報機構(gòu)和圖書館都是在參考這部國家詞表的基礎(chǔ)上編制自己詞表的。在編表過程中,抽取主題詞時當盡可能不破壞原有詞表的詞間關(guān)系。但必要時,詞間關(guān)系及基本范疇還是需要重新確定的。
由于地方文獻是對某一地域自然和人文現(xiàn)象的客觀描述,它所表現(xiàn)出的地域性和專指性極強。用綜合性的《漢表》來標引各地的地方文獻,則將有相當部分的文獻不能被準確地表達其主題概念;其次,地方文獻的內(nèi)容范疇與《漢表》中的基本范疇也有所不同?!稘h表》是以學科體系作為劃分范疇的基本依據(jù);而地方文獻則是以特定地方的自然環(huán)境、人文環(huán)境和地方事業(yè)作為劃分范疇的基本依據(jù)。所以地方文獻主題詞表需要在《漢語主題詞表》的基礎(chǔ)上自行編制。
地方文獻主題詞表中所收錄的主題詞來源主要有:
①《漢表》中已有的詞匯。這是地方文獻與非地方文獻都使用的綜合性詞匯,它占將來的地方文獻主題詞表所收詞匯的絕大部分。由于是從《漢表》中選詞,所以它們是相對規(guī)范的。
②《漢表》中沒有的,帶有地方特點的詞匯,如:北京地方文獻的“琉璃廠”、天津地方文獻中的“皇會”、廣東地方文獻中的“早茶”等,這部分詞匯雖然在未來的地方文獻主題詞表中所占比例不會很大,但它們卻是出現(xiàn)頻率相對較高的詞匯。對于這部分詞匯及其詞間關(guān)系,地方文獻工作者需要加以規(guī)范。
③《漢表》作為階段性產(chǎn)品,它的編制受時間的限制,對于編表以后新產(chǎn)生的一些詞匯它不可能收錄,在新編的地方文獻主題詞表中收錄這部分詞,也需要加以規(guī)范。
由于編制先組式的主題詞表需要一段相當長的時間,同時還要編制一系列的標引細則,這將會影響報刊信息庫主題標引工作的迅速展開。因此,可以采用另一種方式,即首先確定一段時間為試驗期,先進行地方文獻的標引工作。由標引人員直接從報刊所載的地方文獻信息內(nèi)容中選取有檢索意義的關(guān)鍵詞作為主題詞。這種主題詞是未經(jīng)規(guī)范的自然語言,也無詞間關(guān)系可言,待積累了一定數(shù)量之后,再對其進行修改、充實,并參照《漢表》使之規(guī)范化。確定好詞間關(guān)系和基本范疇,從而形成適用的詞表。這種詞表是后控式的,采用這種方式選詞更直觀,專指性強,還能使標引工作與修改詞表同時進行。而且標引時不用考慮詞間關(guān)系及查表抽詞,所以標引速度快。在標引時采用自然語言,對標引人員的要求也相對較低。目前,廣東省中山圖書館的地方文獻數(shù)據(jù)庫系統(tǒng)主題標引就采用了這種方法。
2.2主題詞字段的設(shè)置
無論是先有詞表,還是先進行標引工作,在報刊信息庫中,都需要設(shè)置若干個主題詞字段,以便展開具體的標引工作。在設(shè)置主題詞字段時,一定要注意反映地方文獻的時空特征;在空間方面完整、系統(tǒng)地記錄特定地域內(nèi)自然和人文方面的各種信息;在時間上又形成了一個連續(xù)的信息集合。這是一切地方文獻工作最基本的原則。
在報刊信息庫中,首先應(yīng)設(shè)置涉及文獻基本內(nèi)容的“內(nèi)容主題詞”字段。此字段選詞靈活性大,標引的內(nèi)容也十分廣泛。它對所有地方文獻信息的內(nèi)容范疇進行涵蓋,也是以后編制地方文獻主題詞表時確定詞表基本范疇的依據(jù)。從地方文獻的性質(zhì)和特征來看,它是對特定地區(qū)自然、社會、人文諸般事物的歷史與現(xiàn)狀進行全面系統(tǒng)地綜合性記錄,涉及的內(nèi)容極為廣泛。如反映一個地區(qū)所能觀察到的天文現(xiàn)象、地質(zhì)水文結(jié)構(gòu)、地形地貌、氣候與氣象、物種與資源以及反映該地區(qū)的人文地理、歷史、地方人物、社會經(jīng)濟、地方政治、社會結(jié)構(gòu)、地方文化、教育等各個方面。
報刊信息庫中“內(nèi)容主題詞”字段的主題詞性質(zhì)絕大部分是綜合性的,與其它非地方文獻數(shù)據(jù)庫中的主題詞無太大區(qū)別。例如“社會治安”,“計量管理”、“住宅區(qū)”、“軟件產(chǎn)業(yè)”等;也有一部分是地方文獻內(nèi)容所特有的地方性詞匯,如“敦煌石窟”、“庚子”、“廠甸”等;另外,新產(chǎn)生的一些地方文獻信息的內(nèi)容,也應(yīng)通過內(nèi)容主題詞來表達??傊彩巧婕暗降胤轿墨I的所有內(nèi)容特征,都應(yīng)在此字段予以反映。
這一字段并非地方文獻數(shù)據(jù)庫所特有,有關(guān)具體標引方法的討論從略。
另一種主題字段的設(shè)置應(yīng)反映地方文獻內(nèi)容特征以外的其它特征。地方文獻最大的特點,就在于文獻所記載的現(xiàn)象、事實和人物都被限定在某一特指的時空范圍內(nèi)。也就是說。地方文獻所涉及的內(nèi)容范疇均會通過特定的時間、地點、團體機構(gòu)、人物等因素反映和輸出。地方文獻用戶的檢索習慣也往往是從某一地域范疇、地區(qū)名稱、某一事件、某一人物入手。因此,有必要在地方題錄庫中設(shè)置“地域主題詞”、“時間主題詞”、“團體主題詞”和“個人主題詞”諸字段。它們是揭示地方文獻的本質(zhì)特征所必須的字段。同時也是地方文獻數(shù)據(jù)庫系統(tǒng)中所特有的。
以上四個主題詞字段所反映的是有關(guān)地方文獻信息中客觀存在的某些因素,如“地域主題詞”中的“東城區(qū)”、“梅山縣”、“個人主題詞”中的“梅蘭芳”、“秋瑾”等。盡管這四種主題詞的標引與“內(nèi)容主題詞”的標引相比,相對容易些,但仍需積累到一定數(shù)量后進行規(guī)范。例如“團體主題詞”中的機構(gòu)名稱是用全稱還是用簡稱,以及“個人主題詞”中的人物名稱是用本名還是用筆名,這些都需要地方文獻工作者在以后的工作中根據(jù)本地區(qū)的具體情況加以規(guī)范。
具體的標引方法是:
地域主題所標引的不是整體地方文獻的地域,而是文章內(nèi)容涉及的某一具體區(qū)域的名稱,或者給文章內(nèi)容帶來影響的區(qū)域名稱。如有關(guān)北京地方文獻的內(nèi)容不用標“北京”,直接標引具體的“東城區(qū)”、“昌平縣”等行政區(qū)劃名稱;內(nèi)容涉及到較具體的地名時也可標引地名,例如“王府井大街”、“方家胡同”等;如果文章中所反映的地區(qū)更詳細,區(qū)(縣)、街道(鄉(xiāng)鎮(zhèn))、村等具體名稱都有,可逐級進行標引,中間用分隔符隔開,如北京地方文獻中的“順義縣%趙全營鎮(zhèn)%北郎中村”;在標引中,遇到舊有的行政區(qū)劃名稱或舊地名時,為反映某一地區(qū)名稱的歷史發(fā)展沿革,應(yīng)將現(xiàn)行行政區(qū)劃名稱與舊有行政區(qū)劃名稱同時標引作為檢索點,現(xiàn)有行政區(qū)劃名稱或新地名標在前面, 舊行政區(qū)劃名稱或舊地名注于其后,可用括號括起。如“東城區(qū)(內(nèi)三區(qū))”。以上的標引方法主要是針對地方文獻用戶特定的檢索需求而言。
年代主題標引的是文獻內(nèi)容所涉及的時間范圍,而不是文獻撰寫或出版發(fā)行的時間。清以前的歷朝歷代均可使用“朝代%年號”的方法標引.如“清代%乾隆”,中華民國時期(1919年前)可標引成“民國時期”,到了1920年以后可以標引成“二十年代”、“六十年代”等。
團體主題和個人主題標引的是文章內(nèi)容所涉及到某一具體機構(gòu)、個人,或與某地方有關(guān)系的機構(gòu)和個人。團體主題標引時,用機構(gòu)和單位的標準全稱,如“北京市中級人民法院”、“重慶市技術(shù)監(jiān)督局”等;而個人主題的標引,是標具體人名,例如“梅蘭芳”;如果遇到同一人物有本名與筆名時,要同時標引,如“魯迅”與“周樹人”、“老舍”與“舒舍予”之間可用符號“%”隔開;遇到清代人物或少數(shù)民族人物的名稱較長時,一般應(yīng)標引人物的全名,如“愛新覺羅·溥儀”。
總之,無論標引什么類型的主題詞,標引人員都要站在用戶的角度,即從索引的終極使用目的出發(fā),給地方文獻實際使用者提供有價值的地方文獻信息。因此,在對報刊信息庫進行主題標引過程中一定要確定好標引深度。地方文獻報刊索引的標引深度,則取決于地方文獻各類用戶的檢索需求。地方文獻的研究級用戶的檢索需求包括:決策、管理人員宏觀的檢索需求、科研人員較專深的檢索需求及設(shè)計生產(chǎn)人員的針對性檢索需求等。
盡管采用數(shù)據(jù)庫系統(tǒng)處理地方文獻信息這一手段在全國各類圖書館的地方文獻業(yè)務(wù)中開展得還不夠普遍,但這是地方文獻工作發(fā)展的必然趨勢。結(jié)合地方文獻本身的特點來制訂適用的主題詞表、分類表,是實現(xiàn)地方文獻信息處理標準化的必要步驟。它可為今后進行聯(lián)機檢索,進入國家和地區(qū)網(wǎng)絡(luò),從而實現(xiàn)地方文獻資源共享打下堅實的基礎(chǔ)。同時,計算機多途徑檢索所產(chǎn)生的效果也會使地方文獻信息資源得以更充分地研究與利用。
參考文獻
1 韓樸.圖書館地方文獻工作.北京:文津出版社,1992
2 中國科學技術(shù)情報研究所.北京圖書館.漢語主題詞表.北京:科學技術(shù)文獻出版社,1979