pt电子娱乐平台老虎机:稅務大數據分析的技術和典型應用 - pt电子色卡|pt电子游戏破解器软件

pt电子娱乐平台老虎机:

登錄 注冊
pt电子色卡> 知識庫> 稅務大數據分析的技術和典型應用

稅務大數據分析的技術和典型應用

來源:杭州金手指會計 金質會計 時間:2019-05-16 00:00:00瀏覽次數:410次

杭州公司注冊、注冊公司、公司注冊、杭州代理記賬、代理記賬、稅務籌劃、杭州稅務籌劃、高新企業認定、市高新企業認定

稅務大數據分析的技術和典型應用

基于某省稅務局大數據分析項目的實踐,結合稅務機關的信息化建設現狀和業務特點,說明了如何搭建適合于稅務業務應用的大數據分析平臺,并結合具體的應用案例,說明運用大數據開展業務應用的過程、建模方法和數據處理方法。通過對比大數據與傳統信息化建設方式的差異,說明大數據將為稅務機關的信息化建設帶來全新的突破,提供更為有力的業務創新手段。

關鍵詞:稅務;大數據;技術架構;數據分析;融合創新


1 稅務信息化建設的成果與問題

稅務機關是我國信息化建設起步較早的領域,特別是隨著以“金稅工程”為代表的信息系統的實施,各省稅務機關基本上都實現了業務信息化的全覆蓋,積累了龐大的數據資源。

但是,受制于業務條塊分隔、粗放式管理等問題,各部門的業務系統大多是獨立建設、自成體系;而且各地稅務機關往往根據業務需求自行開發輔助的應用系統,造成了系統各自為政、標準不統一、業務難以協同、數據無法交換和共享等問題,成為制約稅務業務整合應用、向縱深發展的瓶頸。

例如,納稅服務部門面向納稅人提供綜合的辦稅服務,在“以人為本”的“互聯網+”時代,現有的各個業務系統分散建設和獨立運行的模式,已經嚴重制約了納稅服務下一步的發展,具體表現為以下幾點:

●分散建設的業務系統,難以協同起來為納稅人提供統一的服務;

●業務系統提供的基本都是結果數據,缺乏行為記錄和服務過程信息,難以全面描繪辦稅業務,滿足優化業務的需要;

●基于管理需要而建立的業務系統,無論是渠道、方式、流程或界面,都難以滿足互聯網時代納稅人的服務需求;

●“輔助決策系統”提供的統計數字,在多變的環境下,難以支撐對未來的業務預測;

●海量的數據沉淀在信息系統中,現有技術和方法難以發掘其價值。

以云計算、大數據、移動互聯網為代表的新一代信息技術,提供了全新的技術、渠道和方法,通過與傳統業務的融合創新,正在給世界帶來巨大,甚至是顛覆性的變化,例如:互聯網金融、滴滴出行、精準醫療、自動駕駛汽車等都是典型的代表。國家先后出臺了大量政策文件,積極利用云計算、大數據、移動互聯等新技術推動傳統產業的轉型升級,在國家“十三五”發展規劃中,甚至將大數據上升到國家戰略。

這些新技術也為優化稅務業務帶來了新的發展機遇,國家稅務總局先后發布了《互聯網+稅務行動計劃》《運用大數據開展大企業稅收服務與監管試點工作》等指導文件,推動新一代信息技術在稅務機關的落地實施。

2015年,筆者參與了某省稅務局大數據平臺和分析應用項目的建設,該項目基于省數據中心匯集的全省各個主要業務系統的數據,針對稅務領域的業務問題和發展趨勢,采用大數據方法和技術,抽取相關的數據,建立業務分析模型,開展了面向納稅人的精準服務、業務過程優化、服務渠道轉移關系分析等業務應用。項目于2016年投入了實際運行,在省、市、服務廳各級辦稅部門中應用,有力地推動了稅務機關管理大數據化、辦稅服務精細化、業務改進持續化的建設步伐,取得了稅務局用戶的充分肯定。

本文就是基于該項目的實踐,對稅務機關如何利用大數據推動業務優化、科學決策、精準服務、融合創新進行較為深入的探討。


2 稅務大數據分析平臺技術架構

2.1稅務大數據分析平臺總體框架

傳統的信息技術主要是輔助業務,而大數據已經遠遠超出了技術領域,其力量體現在與業務相結合,優化現有的業務,甚至進行顛覆性的創新,這樣的案例每天都在各個領域發生。稅務機構同樣可以利用大數據預知未來的發展動態,推動業務的轉型升級,優化管理和服務模式。

考慮到大數據與業務的融合是一個長期的過程,為了能持續地開展大數據分析工作,首先要建立稅務大數據分析平臺,統一采集和管理來自各個業務系統的數據,并提供從數據處理到應用展現的一系列功能,支撐基于大數據的業務應用。大數據平臺的總體框架分為:數據源層、數據處理層、應用支撐層、業務應用層,如圖1所示。


 圖1 稅務大數據分析平臺總體框架

數據源層:大數據分析不僅需要稅務機關內部的業務系統數據,而且需要豐富多彩的外部機構數據,這些數據有助于解決更為廣泛的業務問題。

數據處理層:稅務機關內部的數據通過數據同步/抽取工具匯集到數據中心;外部機構的數據通過對應的采集工具,交換到稅務機關內部的數據中心。為了應對呈指數增長的非結構化數據,在云平臺上搭建NoSQL數據庫,用于存儲和處理龐大的數據。

應用支撐層:按照業務分析的要求,建立相應的數據模型,在平臺中封裝了各種分析算法組件和展示模板;為支撐不同的業務應用場景,提供基礎的分析工具(如數據挖掘、網絡分析、可視化等),提供統一的管理工具(如基礎數據管理、數學模型管理、標簽管理、運行維護等)。

業務應用層:針對具體的業務場景,建立眾多基于大數據平臺的“小應用”,解決具體的業務問題;各個“小應用”具有各自的分析功能和展示界面,甚至與社會服務渠道相融合,針對不同的用戶對象提供相應的功能。

 2.2大數據平臺和工具的選擇

隨著“金稅工程”的不斷深入,稅務數據資源的種類不斷豐富,數據量快速增長,特別是近年來飛速增長的電子票據、視頻、網頁等非結構化數據,已經超出了目前的處理能力。如何采集、存儲和利用龐大的涉稅數據,進而從海量的數據中挖掘有價值的信息,已然成為稅收信息化面臨的一個重大課題。從結構化數據轉向大數據是下一步發展的必然選擇。

近年來,大數據平臺呈現出蓬勃發展的態勢,成百上千家廠商提供了眾多大數據平臺產品。大部分大數據產品都具有結構化和非結構化數據的處理、海量數據分布式存儲、彈性擴容等基本功能,因此,稅務機關在選擇大數據平臺時,主要應該考慮與具體業務應用場景相關的一些因素,具體情況如下。

●發行版本:大部分廠商的大數據平臺都是建立在Hadoop之上的發行版,附加了一些工具和服務支持。不同于結構化數據庫,大數據工具的選擇取決于要處理哪種數據,不可幻想有一個大數據平臺能夠適應各種應用場景。另外,政府機構還必須把是否國產軟件列入考慮因素。

●數據處理效率:很多大數據平臺非常適合非結構化數據處理,但是在結構化數據處理方面卻遠遜于傳統的結構化數據庫。而目前稅務機構的業務數據主要是海量結構化數據,對結構化數據的處理效率是必須關注的一個重點問題。當然,非結構化數據的處理,更是需要考慮的關鍵問題。

●對復雜類型的數據管理和分析能力:稅務領域的業務應用場景非常廣泛,涉及的數據類型和來源也非常豐富,因此對數據的加工處理、分析挖掘能力的要求也比較高。

●運維、監控工具的便捷性:稅務領域的數據源非常廣泛,很多應用場景需要進行實時分析,但是數據源經?;岱⑸浠?,直接影響采集的數據質量,因而需要有工具監測數據源和采集數據的異常情況,及時采取糾正措施。

經過項目實踐,推薦的適用于稅務機構的大數據技術實現架構如圖2所示。


圖2 稅務大數據平臺技術架構

2.3數據源和數據采集

大數據采集框架如圖3所示。經過20多年的信息化建設,某省稅務局目前正在使用的應用系統超過100個,主要的系統有金三系統、社保系統、發票在線、自助終端、12366服務熱線等,基本覆蓋了稅務管理各方面的工作內容,其中,金三系統、社保系統等每天都會產生數百萬筆業務數據。另外,稅務業務還涉及工商、質監、交易中心等政府部門的共享數據以及來自移動互聯網、網絡社交媒體等方面的外部數據。數據格式覆蓋了文件、地理信息、日志、圖片、流媒體等多種形態。豐富的數據源,為開展大數據分析奠定了堅實的基礎,而眾多五花八門、來源各異的數據源,也帶來了非常復雜的數據清洗工作。


圖3 大數據采集框架

信息化建設較為發達的省級稅務局一般都建立了數據中心,實時將業務系統的數據(大部分是結構化數據)同步到數據中心,大部分非結構化數據則存儲在原業務系統中,局外的數據通過數據交換接口傳輸到內網,集中存儲到數據中心。

 2.4數據處理

具體的業務分析應用,通過數據接口將涉及的數據從省級數據中心抽取出來,對這些多源、異構、海量的原始業務數據進行清洗、轉換、對碰等預處理,將數據存儲到大數據庫,形成針對不同業務分析的數據集。例如:辦稅事項的預測場景中,需要將辦稅業務劃分為12個大類、180多個事項,通過與金稅三期核心系統的數據對碰,還原每個辦稅事項的過程信息。

2.4.1數據處理的復雜性

稅務大數據涉及多源、異構、多維、海量的業務數據,處理和分析的復雜度和難度都遠高于傳統的數據分析,具體表現在以下幾點。

●省稅務局一般都有100多個業務系統,各個系統提供的原始數據往往存在標準不統一、一致性低、規范性差等問題,而且系統經常進行更新,需要持續維護數據接口,才能保證原始數據的質量。

●目前,大部分業務系統中記錄的都是結果數據,很難匹配大數據分析需要的分類、分渠道、分時段等過程要求,例如,業務優化、納稅服務等業務都是針對過程進行分析的。

眾多開發商提供的原始業務數據匯集在一起時,由于邏輯關系比較復雜,梳理業務與數據之間的關系需要耗費大量的溝通和梳理工作,清洗、轉換、對碰等預處理的工作量大,而且錯誤率高。

●一些應用場景需要采集外部數據(如地理位置、企業信息、社交網絡等),通過接口導入數據中心,形成對業務的全景式描述。但是,目前外部數據的獲取和質量是各個機構都面臨的難題。

 2.4.2數據匯集流程

受制于業務分隔的問題,每個稅務業務系統只是服務于某個領域的具體業務,當各個業務系統的數據匯集到數據中心的時候,通過將不同來源的數據整合在一起,形成對業務的全盤認識,進而從全局的層面找到更好的方法優化業務,這就是數據匯集的價值所在。圖4是一個比較典型的稅務機關通過數據匯集實現業務優化的案例。


 圖4 典型的稅務數據整合應用的流程

例如,進行納稅服務過程的相關分析時,金三系統中記錄的是納稅結果數據;排隊叫號和納稅人評價系統中有時間數據,但是每次叫號、評價的過程可能會辦理多項業務,以辦稅人和時間為紐帶,將金三系統與排隊叫號和納稅人評價系統中的數據進行對碰,形成辦稅過程的數據;再根據海量的辦稅過程數據——188個辦稅事項的組合,計算分離后不同辦稅事項的辦理時間,由此,還原出每個辦稅人每次辦稅事項的過程數據。有了這些細分的數據,就為業務變化預測、服務流程優化等分析工作提供了堅實的基礎。

 2.4.3辦稅事項數據對碰

由于不同系統從不同維度記錄數據,因此當需要全局數據時,常常需要將幾個系統的數據進行對碰,形成一件事情的全維信息。例如:金三系統記錄了辦稅結果,排隊叫號系統記錄了叫號時間,服務評價系統記錄了評價時間,以納稅人ID為核心將這3個系統的數據進行對碰,就可以形成辦稅事項的過程信息,見表1和表2。


 表1 金三系統(社保等系統與此類似)


表2 排隊叫號系統和服務評價系統

金三系統、排隊叫號系統、服務評價系統分別記錄了辦稅事項的信息,以辦稅員ID為鍵值,將3個系統辦稅事項的時間串聯在一起。由于辦稅員在不同系統中的身份和權限并非完全一致,在不同系統中可能使用了不同的ID,所以,還要將辦稅員的身份一一對應起來,見表3和表4。


 表3 金三系統、排隊叫號系統中的辦稅員ID對應關系


 表4 碰撞結果—辦稅事項的過程信息

以上只是一個簡單的數據對碰示例,實際情況遠比上面列出的情況復雜,例如:不同服務器的時鐘不一致、不同服務廳的操作方法不一致等問題,導致對碰的結果存在較多誤差。以上的對碰示例,通過一系列的規范化操作,最終全省平均準確率達到了78%左右。對碰出來的數據,剔除不準確的數據,剩下的數據量也足夠大,可以得出每個服務廳每個辦稅事項的平均辦理時間。

由此可見,數據對碰是一項不得已而為之的數據處理工作,需要花費大量時間理解不同系統之間的數據邏輯,還要花費大量時間解決對碰不準確的問題,最終的準確率還不一定能讓用戶滿意。這種問題產生的原因就在于當初設計系統時,沒有考慮目前有這么豐富的應用需求,或者不同的部門對數據的需求不一致,需要將不同系統的數據匯集在一起還原當時的辦理信息。

隨著“循數管理”“以數據為中心”思想的深入貫徹,大家會越來越重視原始數據的采集工作,在處理業務的過程中補充自己不需要但是其他部門會需要的數據。這樣,才可以從根本上減輕數據處理的壓力。

 2.4.4應用支撐

本著“大平臺、小應用”的設想,大數據平臺針對業務應用,提供了開發工具、分析工具和管理工具,為基于大數據的創新應用提供技術支撐??⒐ぞ甙üぷ髁?、模型引擎、可視化、視頻等應用組件,分析工具包括數據挖掘、機器學習、網絡分析、可視化展現等,管理工具包括基礎數據管理、數學模型管理、標簽管理、運行維護等。這些平臺上的支撐工具,使得各個業務部門可以按照業務需求,自行搭建應用系統,更加自主、快速、靈活。

大數據分析與基于數據倉庫的商業智能(business intelligence,BI)分析有非常顯著的差異,BI分析通常都是基于明確的業務邏輯和數據邏輯。而大數據要解決的問題開始時往往都只有大致的方向,需要收集信息和數據逐步明確問題,分析過程中通常也不是依靠邏輯關系建立數學模型,而是通過訓練數據發現數據之間的關聯關系,建立相應的數據模型,甚至直接通過數據得出結論。大數據可以適用的分析方法比BI更加豐富,需要數學家、業務專家和數據處理專家的緊密配合才能完成。

 2.4.5業務應用

大數據與稅務業務相融合,應用的范圍和發揮的作用都遠超以往信息化建設的成果,成為帶動稅務深化改革的利器。例如:納稅人涉稅風險評估、稅收政策效果測度、面向納稅人的精準服務、辦稅流程優化等。

我國的稅務改革呈現小步快跑的方式,在未來幾年將發生一系列改變。如何保證政策的科學性、合理性,將變化控制在預期的范圍中?以前很多情況都是憑借經驗做出決策,而采用大數據技術和方法,就可以根據積累的數據,分析得出采取某項措施后,可能帶來的影響。在某省稅務局的大數據分析項目中,利用大數據技術和方法小試牛刀,在采集整合各業務系統、各辦稅服務渠道和外部機構數據的基礎上,構建能夠實時、全程、多元反映納稅服務運行狀態的業務模型,完成了政策影響分析、辦稅事項業務量預測、面向納稅人的精準服務等應用場景,取得了非常好的效果。

3 基于稅務大數據平臺的業務應用示例

稅務機關擁有海量的數據資源,也有豐富的應用場景,推動業務與新一代信息技術(如云計算、大數據、物聯網、移動互聯)相融合,可以突破以往信息系統的輔助作用,以技術推動稅務業務的創新發展。

下面以一個簡單的大數據應用案例,說明如何開展大數據的分析應用。

 3.1案例:服務能力匹配度分析

隨著稅制改革和電子辦稅的深入推進,未來辦稅服務廳的業務將發生哪些變化?如何調整資源配置,能夠匹配業務的變化?

針對這個業務場景,運用大數據解決問題的過程如圖5所示,具體如下。


 圖5 服務能力匹配分析的過程

●將來自不同業務系統的數據從數據中心抽取到NoSQL數據庫中,經過清洗、對碰等處理后,形成關于政策影響分析需要的數據集。

●基于業務經驗,篩選影響因子,建立數學模型,通過訓練數據確定相關度較高的影響因子,建立政策影響模型、188個辦稅事項的業務形態模型和各個服務廳的業務形態模型。

●選擇近期的月份作為測試數據,驗證模型的準確性,如果可信度能達到預期,就依據現有的參數建立預測模型,否則返回修正因子或者算法,或者查找數據問題。

●利用建立的數學模型,預測政策變化后業務量的形態。

●針對每個服務廳,基于以往的數據,建立服務廳效能模型。

●將預測的業務形態輸入辦稅服務廳效能模型,計算完成所有業務量需要的時間,與辦稅服務廳所能提供的總服務時長進行對比分析。

●根據未來業務的變化趨勢和服務廳的效能,采取優化措施,例如:調整服務廳/服務人員的配置;優化業務流程;改進應用系統的處理效率等。

服務能力匹配分析的案例中,關鍵就是建立業務量的預測模型,188個辦稅事項中有些與稅期相關,有些與節假日相關,有些周期性明顯,有些具有隨機性,而且每個服務廳的業務形態也不一樣,應對不同服務廳不同辦稅事項建立各自的業務量預測模型。傳統的數據建模方法是建立模型,通過歷史數據計算參數,形成業務模型;而在大數據時代,機器學習、數據挖掘以及人工智能等算法提供了更為豐富的建模手段。例如,業務量預測模型就是利用機器學習的方法,具體過程如下。

●基于不同服務廳不同辦稅事項的歷史數據建立各自的訓練集,篩選影響業務量變化的因子。

●使用關鍵影響因子(如日期、稅期、節假日等)擬合訓練集數據,選擇合適的數學模型,利用訓練集數據不斷優化計算模型中的各項參數,例如:先后嘗試了一元一次線性回歸、多元線性回歸、多元二次線性回歸等方法,不斷逼近回歸模型中的系數和指數等參數的最優解。

●將建立的預測模型應用于驗證集數據,檢驗模型的預測效果能否達到預期目標,如果不理想,增加數據來源,嘗試不同的數據變換,進一步選擇擬合度高和泛化能力強的數學模型,優化業務量預測模型預測結果和計算速率。

●如此反復多次,最終確定每個服務廳的每個辦稅事項的數學模型。

例如:在項目執行期間,恰逢2016年5月1日開始推行營業稅改增值稅(以下簡稱“營改增”),系統在4月份預測了“營改增”后辦稅業務的變化形態,并以可視化的方式展現出來。預測結果與實際情況對照,全省每天的預測結果與實際值差距在7%以內,各市每天的預測結果基本在15%以內,規模較大的服務廳每天的預測結果基本在21%以內(規模較小的服務廳由于業務的隨機性較大,預測的價值不大),預測準確度屬于比較高的水平。而且,預測結果比業務人員憑經驗估算的結果更接近真實情況。此外,系統計算速度完全滿足業務要求,能夠將業務量預測結果及時有效地反饋給相關部門。

基于預測結果,可以有針對性地調整服務廳的資源配置(如人員、窗口、時間等),系統最終呈現出來的業務量與服務能力匹配情況,如圖6所示。


 圖6 某服務廳在“營改增”前后的業務形態和能力匹配情況

 3.2其他業務應用案例

在項目實施過程中,還開展了其他的業務應用,具體如下。

●面向納稅人的微信推薦:以納稅人為中心,從內、外多個數據源采集納稅人的信息,通過采用主成分分析、獨立成分分析和聚類算法等數據分析方法,為每個納稅人繪制“畫像”,建立特征標簽;根據納稅人的特征,在開展活動時,選擇符合條件的納稅人群,發送特定的信息。

●服務廳分級管理:采用大數據的方法,對候選的15個評價指標,通過降維、主成分分析、特征矩陣分裂等機器學習方法,選取相關度最大的7類指標項;從業務數據中計算出自適應的權重系數,采用關鍵績效指標(keyperformanceindicator,KPI)算法計算服務廳的標準得分,采用聚類算法劃分出服務廳的類別。

●服務人員畫像:采集業務系統中與服務人員相關的數據和外部信息,從屬性、效能、滿意度、負荷、獨立性5個維度進行畫像描述,展現服務人員的總體特征和詳細特征,為辦稅流程的優化、資源配置的優化和服務能力指數的建立提供基礎信息。

針對不同的應用場景,采用不同的分析方法,建立不同的模型,運用不同的處理手段,從中可以看到:大數據推動了稅務業務與更廣泛的外部資源相結合,遠遠超出以往信息化建設的范圍,能夠在更多的領域,采用更多的手段解決業務問題。

而且,大數據將帶給稅務信息化三大轉變:從關注結果向關注過程的服務視角轉變;從分散系統向協同運作的應用模式轉變;從經驗管理向精準管理的粒度轉變,因而其發展潛力極其巨大。

4 結束語

大數據在稅務領域的應用,目前還處于起步階段,在項目中只是在大數據分析方面做了很小的嘗試,還有非常豐富的業務場景有待發掘。

基于實踐經驗可以得出以下結論。

●數據采集和處理是目前大數據應用的首要問題。隨著稅務深化改革,面向納稅人提供服務將成為重點建設內容,要實現這個轉變,就必須圍繞納稅人采集過程信息和行為信息,這是目前稅務信息系統沒有的,也是現階段進行大數據分析面臨的最主要問題。下一步的稅務信息化建設,必須重視對業務過程數據和納稅人行為數據的采集工作。

●以大數據為代表的新一代信息技術,將徹底改變稅務信息化的應用模式。越來越多的數字化設備、音視頻、傳感器等收集了豐富的數據,互聯網將社會的各種機構連接在一起,大數據平臺提供了各類數據的處理功能,云計算將信息化的分層結構轉變為網狀結構,移動互聯網終端又將各種業務匯集到納稅人的手上。稅務信息化面臨巨大的變革,與新一代信息技術相融合,將能夠產生前所未有的應用場景。

●從傳統BI向大數據分析的演進。大數據分析方法與傳統BI采用了不同的處理方法,其三大特征(使用全樣本數據;使用混雜的數據,放棄對數據精確性的要求;通過現象之間的聯系進行預測,放棄對因果關系的探求)更貼近于稅務實際工作中的情況。采用大數據技術和方法,基于各個領域的數據,可以使業務部門更加清晰地了解業務的細節,更為透徹地理解業務的形態,預知實施改進措施后的業務變化情形,從而更有目的地優化業務過程,改進服務方法。

相關資訊

云南时时中三 抢庄牌九心得 免费计划软件app大全下载 北京单场过关投注方式 极速赛车稳赚图片 qq群用时时彩计划软件 三d四码组六遗漏 11选5拖胆中奖规则 幸运飞艇有规律吗 中国福彩投注订单助手 牌九棋牌可提现版 百人炸金花无限金币版 模拟投注app 双人斗地主二人斗地主玩法 博格巴 mg娱乐网址是多少