欧洲成人午夜精品无码区久久_久久精品无码专区免费青青_av无码电影一区二区三区_各种少妇正面着bbw撒尿视频_中文精品久久久久国产网址

學(xué)術(shù)刊物 生活雜志 SCI期刊 投稿指導(dǎo) 期刊服務(wù) 文秘服務(wù) 出版社 登錄/注冊 購物車(0)

首頁 > 精品范文 > 數(shù)據(jù)分析論文

數(shù)據(jù)分析論文精品(七篇)

時間:2023-08-10 16:50:42

序論:寫作是一種深度的自我表達(dá)。它要求我們深入探索自己的思想和情感,挖掘那些隱藏在內(nèi)心深處的真相,好投稿為您帶來了七篇數(shù)據(jù)分析論文范文,愿它們成為您寫作過程中的靈感催化劑,助力您的創(chuàng)作。

數(shù)據(jù)分析論文

篇(1)

1.1壟斷

世界多數(shù)大國在近一百多年來在供電上采取的模式是集發(fā)電、輸電、配電為一身的壟斷模式。國家在電力供應(yīng)上大多數(shù)或全部由國家壟斷經(jīng)營,廣大電力用戶就是消費者。這種壟斷經(jīng)營在短時間內(nèi)使電力工業(yè)聚集了大量的資金,電力工業(yè)持續(xù)發(fā)展,同時避免了重復(fù)設(shè)施的出現(xiàn),為電網(wǎng)的統(tǒng)一規(guī)劃和建設(shè)提供了有力的支持。

1.2發(fā)電競爭

發(fā)電競爭模式,競爭主要體現(xiàn)在發(fā)電環(huán)節(jié),輸電和配電仍然采取壟斷經(jīng)營。在電力經(jīng)營過程中對電力市場進(jìn)行開放,引入發(fā)電企業(yè),在市場中由壟斷企業(yè)對發(fā)電企業(yè)生產(chǎn)的電力進(jìn)行買斷,然后由壟斷企業(yè)統(tǒng)一賣給電力用戶,這種供電模式的引入加大了市場中電力的供給量。

1.3電力轉(zhuǎn)運

電力運轉(zhuǎn)模式就是合理的將發(fā)電、輸電、配電三個過程進(jìn)行分離,每個發(fā)電廠都獨立成為一個企業(yè),各個發(fā)電廠之間采取公平競爭。市場中的用電大戶,可以低價從電力企業(yè)直接購買電力,利用統(tǒng)一電網(wǎng)實現(xiàn)電力運轉(zhuǎn)。在電力運轉(zhuǎn)模式中,部分競爭市場、壟斷經(jīng)營市場和競爭市場同時存在。

1.4配電網(wǎng)開放

配電網(wǎng)開放模式的主要特點是:發(fā)電、輸電、配電三個環(huán)節(jié)適當(dāng)分離,三個環(huán)節(jié)都各自成為獨立的經(jīng)營體系,三者之間存在電力買賣關(guān)系。這種經(jīng)營模式將發(fā)電、輸電、配電三者打破了傳統(tǒng)的電力運營管理模式,電力市場形成了多種商家相互競爭的形式,這不僅增加了發(fā)電企業(yè)之間的相互競爭,客戶可以通過自己的需求來選取適當(dāng)?shù)陌l(fā)電商,而且電力消費者和生產(chǎn)者之間形成了一種真正的買賣格局,從而為電力顯示商品特性提供了便利條件。

2企業(yè)多維數(shù)據(jù)分析具有的特點

2.1多維性

多維數(shù)據(jù)分析的一個最重要特點就是多維性。多維性不僅體現(xiàn)了人們在觀察世界時的多角度,同時也體現(xiàn)了多層次觀察。例如,在銷售量數(shù)據(jù)的查看上可以從時間維入手,同時還可以從年、季、月等時間層次上進(jìn)行查看。對數(shù)據(jù)進(jìn)行分層查看,不僅符合事物的客觀運行規(guī)律,而且也能讓用戶全面地掌握數(shù)據(jù)情況。

2.2實時性

實時性不僅滿足了用戶在時間上對信息的需求,而且可以快速查找多維數(shù)據(jù)的分析結(jié)果,同時實現(xiàn)了實時的接受用戶所反饋的數(shù)據(jù)。

2.3開放性

多維數(shù)據(jù)分析支持多數(shù)據(jù)源和系統(tǒng)平臺。因此,在實際工作中,不論數(shù)據(jù)存儲量有多大,存儲在何處,采取何種方式對數(shù)據(jù)進(jìn)行存儲,都可以及時獲取到存儲的數(shù)據(jù),并且可以以多種方式將分析結(jié)果提供給不通過平臺上的客戶使用。

2.4可分析性

可以從不同的角度對數(shù)據(jù)的最大值、平均值、最小值、匯總進(jìn)行記錄和處理,將龐大的有用數(shù)據(jù)提供給客戶,此外還具有數(shù)據(jù)分析和數(shù)據(jù)查詢等能力。

2.5安全性

確保信息的安全,避免受到欺詐,對用戶進(jìn)行分級管理,數(shù)據(jù)分析過程中,對于數(shù)據(jù)分析結(jié)果只能提供給相應(yīng)的用戶。如果在實際工作中,存在多個用戶共同應(yīng)用同一個分析時,應(yīng)當(dāng)對客戶的級別進(jìn)行合理劃分,依據(jù)客戶所處的安全級別,允許客戶查看對應(yīng)層次的信息。

3電力營銷多維數(shù)據(jù)分析過程

(1)依據(jù)決策者和企業(yè)業(yè)務(wù)在信息上的需求,對多維數(shù)據(jù)分析主題進(jìn)行確定,在進(jìn)行多位數(shù)據(jù)分析時,依據(jù)面向主題分析獲取信息,從而實現(xiàn)為決策者提供信息的目的。

(2)收集數(shù)據(jù),目前供電企業(yè)信息系統(tǒng)收集了電量的業(yè)務(wù)數(shù)據(jù),這些數(shù)據(jù)都存儲在各個供電企業(yè)的信息系統(tǒng)中,為了使其能夠更好的為企業(yè)所用,應(yīng)當(dāng)建立數(shù)據(jù)庫服務(wù)器,采集供電企業(yè)中數(shù)據(jù)。多維數(shù)據(jù)分析在電力決策的實際應(yīng)用中,數(shù)據(jù)采集工作需要依據(jù)多維數(shù)據(jù)分析主體進(jìn)行,要對數(shù)據(jù)庫系統(tǒng)進(jìn)行確認(rèn),并且在構(gòu)建面向分析時選擇數(shù)據(jù)庫,從數(shù)據(jù)庫系統(tǒng)中抽取、轉(zhuǎn)換企業(yè)需要的數(shù)據(jù)。數(shù)據(jù)倉庫是集成的、面向主題的且在實際運行過程中容易因為時間變化而發(fā)生改變的一個數(shù)據(jù)集合。數(shù)據(jù)倉庫是企業(yè)為數(shù)據(jù)分析工作而設(shè)計的,利用數(shù)據(jù)倉庫可以為多維數(shù)據(jù)分析提供更加穩(wěn)定且具有針對性的數(shù)據(jù),目前許多電氣企業(yè)都構(gòu)建了數(shù)據(jù)服務(wù)器。

(3)多維數(shù)據(jù)模型的建立,多維數(shù)據(jù)分析需要以多維數(shù)據(jù)模型為基礎(chǔ),從哪些角度對多維數(shù)據(jù)模型進(jìn)行觀察,對哪些數(shù)據(jù)進(jìn)行分析,可以通過多維數(shù)據(jù)分析決定哪些數(shù)據(jù)需要仔細(xì)分析歷史數(shù)據(jù)結(jié)構(gòu)來獲得,從獲取的數(shù)據(jù)中找到有用的數(shù)據(jù)構(gòu)建成適當(dāng)?shù)亩攘?、維度從而構(gòu)成高效的多維數(shù)據(jù)模型。

(4)設(shè)計人員依據(jù)現(xiàn)有的多維數(shù)據(jù)模型,選取適當(dāng)?shù)亩攘亢途S度,結(jié)合報表利用適當(dāng)?shù)慕y(tǒng)計方法,通過圖表直觀地展現(xiàn)企業(yè)的大量了歷史數(shù)據(jù)。

(5)信息,通過靈活的方式將電力企業(yè)想要的相關(guān)信息直接提供給決策者。

4分析電力影響數(shù)據(jù)主題

在電力營銷決策中,每一個主體都對應(yīng)一個具體的分析,表示一種營銷決策者在工作中需要掌握的信息。本文在研究上將分析主體分為用戶情況、購電情況、電價情況、電費回收、設(shè)備資產(chǎn)情況等,并對較大的主體進(jìn)行了進(jìn)一步劃分,針對電力營銷的數(shù)據(jù)分析,應(yīng)當(dāng)從宏觀到微觀,從多個角度對電氣企業(yè)的數(shù)據(jù)進(jìn)行科學(xué)分析,為電力企業(yè)的各級領(lǐng)導(dǎo)者提供決策信息。因此,在分析上還需要確定分析層次和分析角度。

5結(jié)論

篇(2)

1.1數(shù)據(jù)采集

數(shù)據(jù)的采集是指利用傳感器、社交網(wǎng)絡(luò)以及移動互聯(lián)網(wǎng)等方式獲得的各種類型的結(jié)構(gòu)化、半結(jié)構(gòu)化以及非結(jié)構(gòu)化的海量數(shù)據(jù),這是一切數(shù)據(jù)分析的基礎(chǔ)。數(shù)據(jù)的采集需要解決分布式高速高可靠數(shù)據(jù)的采集、高速數(shù)據(jù)全映像等數(shù)據(jù)收集技術(shù)。還要設(shè)計質(zhì)量評估模型,開發(fā)數(shù)據(jù)質(zhì)量技術(shù)。而數(shù)據(jù)采集一般分為大數(shù)據(jù)智能感知層:主要包括數(shù)據(jù)傳感體系、網(wǎng)絡(luò)通信體系、傳感適配體系、智能識別體系及軟硬件資源接入系統(tǒng),實現(xiàn)對海量數(shù)據(jù)的智能化識別、定位、跟蹤、接入、傳輸、信號轉(zhuǎn)換、監(jiān)控、初步處理和管理等。

1.2數(shù)據(jù)預(yù)處理

數(shù)據(jù)采集的過程本身就有會有很多數(shù)據(jù)庫,但如果想達(dá)到有效分析海量數(shù)據(jù)的目的,就必將這些來自前端的數(shù)據(jù)導(dǎo)入到一個集中的大型分布式數(shù)據(jù)庫,或者分布式存儲集群,而且在導(dǎo)入基礎(chǔ)上做一些簡單的辨析、抽取、清洗等操作。

①抽取:因為我們通過各種途徑獲取的數(shù)據(jù)可能存在多種結(jié)構(gòu)和類型,而數(shù)據(jù)抽取過程可以有效地將這些復(fù)雜的數(shù)據(jù)轉(zhuǎn)換為單一的結(jié)構(gòu)或者便于處理的類型。以達(dá)到快速分析處理的目的。

②清洗:對于海量數(shù)據(jù)而言,數(shù)據(jù)所處的價值層次不一樣,就必然存在由于價值低而導(dǎo)致開發(fā)成本偏大的數(shù)據(jù),還有與數(shù)據(jù)分析毫無關(guān)系的數(shù)據(jù),而另一些數(shù)據(jù)則是完全錯誤的干擾項,所以對數(shù)據(jù)通過過濾“去噪”從而提取出有效數(shù)據(jù)是十分重要的步驟。

1.3數(shù)據(jù)的存儲與管理

當(dāng)我們采集數(shù)據(jù)完成后,就需要將其存儲起來統(tǒng)一管理,主要途徑就是建立相應(yīng)的數(shù)據(jù)庫,進(jìn)行統(tǒng)一管理和調(diào)用。在此基礎(chǔ)上,需要解決大數(shù)據(jù)的可存儲、可表示、可處理、可靠性及有效傳輸?shù)葞讉€關(guān)鍵問題。還需開發(fā)可靠的分布式文件系統(tǒng)(DFS)、能效優(yōu)化的存儲、計算融入存儲、數(shù)據(jù)的去冗余及高效低成本的大數(shù)據(jù)存儲技術(shù);以及分布式非關(guān)系型大數(shù)據(jù)管理與處理技術(shù)、異構(gòu)數(shù)據(jù)的數(shù)據(jù)融合技術(shù)、數(shù)據(jù)組織技術(shù)、研究大數(shù)據(jù)建模技術(shù)、索引、移動、備份、復(fù)制、可視化技術(shù)。

1.4數(shù)據(jù)的統(tǒng)計分析

一般情況下,統(tǒng)計與分析主要就是利用分布式數(shù)據(jù)庫,或者分布式計算集群來對存儲于其內(nèi)的海量數(shù)據(jù)進(jìn)行普通的分析和分類匯總等,以滿足大多數(shù)常見的分析需求,在這方面,一些實時性需求會用到EMC的GreenPlum、Oracle的Exadata,以及基于MySQL的列式存儲Infobright等,而一些批處理,或者基于半結(jié)構(gòu)化數(shù)據(jù)的需求可以使用Hadoop。統(tǒng)計與分析這部分的主要特點和挑戰(zhàn)是分析涉及的數(shù)據(jù)量大,其對系統(tǒng)資源,特別是I/O會有極大的占用。

1.5數(shù)據(jù)分析與挖掘

所謂數(shù)據(jù)挖掘是指從數(shù)據(jù)庫中的大量不完全的、有噪聲的、模糊的、隨機的實際應(yīng)用數(shù)據(jù)中,揭示出隱含的、先前未知的并有潛在價值的信息的過程。與前面統(tǒng)計和分析過程不同的是,數(shù)據(jù)挖掘一般不會有預(yù)先設(shè)計好的主題,主要是在現(xiàn)有數(shù)據(jù)上面進(jìn)行基于各種算法的計算,從而起到預(yù)測(Predict)的效果,從而實現(xiàn)一些高級別數(shù)據(jù)分析的需求。比較典型的算法有用于聚類的K-means、用于統(tǒng)計學(xué)習(xí)的SVM和用于分類的NaiveBayes,主要使用的工具有Hadoop的Mahout等。該過程的特點和挑戰(zhàn)主要是用于挖掘的算法很復(fù)雜,并且計算涉及的數(shù)據(jù)量和計算量都很大,常用數(shù)據(jù)挖掘算法都以單線程為主。

2數(shù)據(jù)分析的8個層次

2.1標(biāo)準(zhǔn)化報告(StandardReports)

標(biāo)準(zhǔn)化報告作為數(shù)據(jù)分析的第一個層次,要求相對較低,主要是借助相應(yīng)的統(tǒng)計工具對數(shù)據(jù)進(jìn)行歸納總結(jié),得出包含主要參數(shù)指標(biāo)的標(biāo)準(zhǔn)化報告。類似于一個銷售企業(yè)每月或者每季度的財務(wù)報表。

2.2即席查詢(AdHocReports)

用戶可以通過自己的需求,靈活地選擇查詢條件,系統(tǒng)就能夠根據(jù)用戶的需求選擇生成相應(yīng)的統(tǒng)計報表。即席查詢與普通應(yīng)用查詢最大的不同是普通的應(yīng)用查詢是定制開發(fā)的,而即席查詢所有的查詢條件都是用戶自己定義的。在面向高層的數(shù)據(jù)分析軟件中,用戶隨意添加想要查詢的指標(biāo)按鈕再加上相應(yīng)的限制條件,就可以立即生成可視化的統(tǒng)計結(jié)果,不僅一目了然,而且沒有任何操作難度。

2.3多維分析(QueryDrilldown)

多維分析是指對具有多個維度和指標(biāo)所組成的數(shù)據(jù)模型進(jìn)行的可視化分析手段的統(tǒng)稱,常用的分析方式包括:下鉆、上卷、切片(切塊)、旋轉(zhuǎn)等各種分析操作。以便剖析數(shù)據(jù),使分析者、決策者能從多個角度多個側(cè)面觀察數(shù)據(jù),從而深入了解包含在數(shù)據(jù)中的信息和內(nèi)涵。上卷是在數(shù)據(jù)立方體中執(zhí)行聚集操作,通過在維級別中上升或通過消除某個或某些維來觀察更概括的數(shù)據(jù)。上卷的另外一種情況是通過消除一個或者多個維來觀察更加概括的數(shù)據(jù)。下鉆是在維級別中下降或者通過引入某個或者某些維來更細(xì)致地觀察數(shù)據(jù)。切片是在給定的數(shù)據(jù)立方體一個維上進(jìn)行的選擇操作,切片的結(jié)果是得到了一個二維的平面數(shù)據(jù)(切塊是在給定的數(shù)據(jù)立方體的兩個或者多個維上進(jìn)行選擇操作,而切塊的結(jié)果是得到了一個子立方塊)。轉(zhuǎn)軸相對比較簡單,就是改變維的方向。

2.4儀表盤與模擬分析(Alerts)

儀表盤用于監(jiān)控一些關(guān)鍵指標(biāo)。模擬分析是由操作者動態(tài)地加以調(diào)節(jié)的控件(如滑動塊、可調(diào)旋鈕、選擇框等),來控制管理決策模型行為某些參數(shù)。當(dāng)操作者通過控制面板對模型中的參數(shù)值或變量值進(jìn)行調(diào)節(jié)時,圖形中的曲線、柱形組或分析指標(biāo)等要素就會發(fā)生相應(yīng)的運動,而這種運動正好反映了該參數(shù)的變化對模型行為的影響,如果這種變動引起了模型中最優(yōu)解或其他關(guān)鍵數(shù)字的變化,能夠隨時將關(guān)于這種變化的結(jié)論正確地顯示出來。

2.5統(tǒng)計分析(StatisticallyAnalysis)

我們知道概率論是數(shù)理統(tǒng)計的基礎(chǔ),數(shù)理統(tǒng)計是在其基礎(chǔ)上研究隨機變量,并應(yīng)用概率論的知識做出合理的估計、推斷與預(yù)測。概率論中討論的各種分布在數(shù)理統(tǒng)計中作為統(tǒng)計模型來分析處理帶有隨機誤差的數(shù)據(jù)。典型的數(shù)理統(tǒng)計方法有參數(shù)估計、假設(shè)檢驗和回歸分析。而統(tǒng)計分析主要是對用戶所關(guān)注的問題進(jìn)行推斷、預(yù)測和控制的分析方法。具體可以分為以下三方面:

①描述統(tǒng)計:主要是集中趨勢、離散程度、分布形狀等,統(tǒng)計圖(方圖、箱線圖、散點圖等);

②數(shù)據(jù)的分類匯總;

③基礎(chǔ)統(tǒng)計分析:方差分析、時間序列分析、相關(guān)和回歸分析、(主成分)因子分析等統(tǒng)計分析方法。

2.6預(yù)測(Forecasting)

在統(tǒng)計分析和數(shù)據(jù)挖掘領(lǐng)域,對未來的預(yù)測已經(jīng)有了很多數(shù)學(xué)模型以及解決具體問題的相關(guān)算法。其核心思想便是從歷史數(shù)據(jù)中找出數(shù)據(jù)的發(fā)展模式,然后以這些模式為支點,就可以對未來進(jìn)行預(yù)測。

2.7預(yù)測模型(PredictiveModeling)

隨著數(shù)據(jù)分析學(xué)家對數(shù)據(jù)挖掘技術(shù)的不斷探索,出現(xiàn)了很多預(yù)測模型以及與之相對應(yīng)的算法,但是很難確定某個模型是最精確的,因為不同的領(lǐng)域,不同的條件,對應(yīng)的預(yù)測模型是不一樣的,所以沒有統(tǒng)一化的最優(yōu)模型,只存在有選擇性的最優(yōu)模型。下面介紹幾種典型的預(yù)測模型。

①回歸模型:回歸模型可以分為一元線性回歸模型和多元線性回歸模型。一元線性回歸模型可表示為yt=b0+b1xt+ut,該式表示變量yt和xt之間的真實關(guān)系。其中yt稱作被解釋變量(或相依變量、因變量),xt稱作解釋變量(或獨立變量、自變量),ut稱作隨機誤差項,b0稱作常數(shù)項(截距項),b1稱作回歸系數(shù)。b0+b1xt是非隨機部分,ut是隨機部分。而在很多情況下,回歸模型必包含兩個或更多自變量才能夠適應(yīng)地描述經(jīng)濟(jì)現(xiàn)象各相關(guān)量之間的聯(lián)系,這就是多元線性回歸模型需要解決的問題,其一般形式為:Y=a+b1X1+b2X2+…+bmXm,式中X1、X2、…、Xm是這個多元回歸問題的m個自變量,b1、b2、…、bm是回歸方程對應(yīng)于各自變量的系數(shù),又稱偏回歸系數(shù)。

②貝葉斯網(wǎng)絡(luò):貝葉斯網(wǎng)絡(luò)是基于概率推理的數(shù)學(xué)模型,而概率推理是通過一些產(chǎn)量的信息來獲取其他概率信息的過程。貝葉斯網(wǎng)絡(luò)會建立一個有向無環(huán)圖和一個概率表集合,有向無環(huán)圖中的每一個節(jié)點便是一個隨機變量,而有向邊表示隨機變量間的條件依賴,條件概率表中的每一個元素對應(yīng)有向無環(huán)圖中唯一的節(jié)點,存儲此節(jié)點對其所有直接前驅(qū)節(jié)點的條件概率。貝葉斯網(wǎng)絡(luò)是為了解決不定性與不完整性問題而提出的,在多個領(lǐng)域中獲得廣泛應(yīng)用。

③基于時間序列分析的指數(shù)平滑模型在時間序列分析中指數(shù)平滑模型是最靈活和準(zhǔn)確的方法,在經(jīng)濟(jì)領(lǐng)域也被證明是最有效的預(yù)測模型。在不同的時間序列下,指數(shù)平滑模型可以分為簡單指數(shù)平滑法、帶有趨勢調(diào)整的指數(shù)平滑法、帶有阻尼趨勢的指數(shù)平滑法、簡單季節(jié)指數(shù)平滑法、帶有趨勢和季節(jié)調(diào)整的指數(shù)平滑法五種不復(fù)雜度的模型。

2.8最優(yōu)化

(Optimization)因為優(yōu)化問題往往可以帶來巨額的收益,通過一系列可行的優(yōu)化,可以使收益得到顯著提高。所謂最優(yōu)化就是從有限或者無限種可行的方案中選取最優(yōu)的方案。如果可以通過簡單的評判,就可以確定最優(yōu)方案那是最好的。但是事實不會那么簡單,所以優(yōu)化技術(shù)已經(jīng)發(fā)展出了一系列的理論來解決實際問題。其常用的優(yōu)化技術(shù)為:

①線性規(guī)劃:當(dāng)目標(biāo)函數(shù)與約束函數(shù)都是線性函數(shù)時,就是一個線性規(guī)劃問題。而當(dāng)同時滿足約束函數(shù)和目標(biāo)函數(shù)時,則可以認(rèn)為是最優(yōu)解。

②整數(shù)規(guī)劃:要求決策變量取整數(shù)值的數(shù)學(xué)規(guī)劃。

③多目標(biāo)規(guī)劃:指衡量一個決策優(yōu)劣的標(biāo)準(zhǔn)不止一個,也就是有多目標(biāo)函數(shù)。

④動態(tài)規(guī)劃:將一個復(fù)雜的問題劃分為多個階段,逐段求解,最終求出全局最優(yōu)解。

3用Excel實現(xiàn)簡單的數(shù)據(jù)分析

①對于企業(yè)而言最重要的是利潤,所以管理者必須要從這張表中得到最關(guān)鍵也最容易得到的銷量和銷售額以及與其相關(guān)的一些數(shù)據(jù),通常是用最基本的數(shù)理統(tǒng)計結(jié)果來直觀地反映該企業(yè)在某個期間的盈利情況。

②其次,我們必須要做進(jìn)一步的分析。已經(jīng)對整體的情況有了一定的把握,所以就可以朝著不同的方向去挖掘一些有價值的信息,為企業(yè)高層做決策提供有力的依據(jù)。對產(chǎn)品銷售而言,客戶結(jié)構(gòu)能夠有效地反映客戶的地域分布,企業(yè)可以根據(jù)客戶的來源,在未開辟客戶的地域去尋找新的目標(biāo)客戶群。而銷量結(jié)構(gòu)可以直觀地反映企業(yè)最大銷量來自哪個地區(qū),對銷量較小的地區(qū)可以加大宣傳力度或者增加銷售網(wǎng)點來保持各地區(qū)銷售均衡。還可以及時地調(diào)整銷售方式來擴大市場份額,而對于銷量最小的地區(qū)考慮開辟新的市場。

統(tǒng)計了各地區(qū)的銷售總額和平均銷售額以及兩者的對比關(guān)系。由此可以得出地區(qū)平均購買力大小,以及各地區(qū)總銷售額大小。借助圖表描述,管理者可以對企業(yè)在某段期間內(nèi)的銷售狀況有一個大概的把握,只有掌握了這些的信息,才能更細(xì)化地去研究具體的影響因素。劃分等級,對于經(jīng)常性大量購買的客戶必須要以最優(yōu)惠的價格和最好的服務(wù)讓其滿意,以形成一個穩(wěn)定的大客戶群。而對于那些少量購買的客戶,也要制定出相應(yīng)合適的方案來留住客戶。所以,分析銷售額的分布情況,可以掌握客戶的購買力度而且還能及時做一些留住大客戶的舉措。

4用R語言實現(xiàn)數(shù)據(jù)多層次分析

R語言是一種自由軟件編程語言與操作環(huán)境,是一套完整的數(shù)據(jù)處理、計算和制圖軟件系統(tǒng),它是一種用來進(jìn)行數(shù)據(jù)探索、統(tǒng)計分析和作圖的解釋型語言。它可以提供一些集成的統(tǒng)計工具,但更大量的是它提供各種數(shù)學(xué)計算、統(tǒng)計計算的函數(shù),從而使使用者能靈活機動地進(jìn)行數(shù)據(jù)分析,甚至創(chuàng)造出符合需要的新的統(tǒng)計計算方法。而在使用R語言進(jìn)行數(shù)據(jù)分析處理時,當(dāng)我們遇到很大的原始數(shù)據(jù),但用來建模的數(shù)據(jù)較小,則可以先在數(shù)據(jù)庫中進(jìn)行整理,然后通過R與數(shù)據(jù)庫的接口提取數(shù)據(jù),數(shù)據(jù)庫適合存放和整理比較規(guī)整的數(shù)據(jù),和R中的數(shù)據(jù)框有良好的對應(yīng)關(guān)系,這也是R中絕大多數(shù)統(tǒng)計模型的標(biāo)準(zhǔn)數(shù)據(jù)結(jié)構(gòu)。數(shù)據(jù)庫中大部分的運算都不需要消耗很大的內(nèi)存。

5結(jié)語

篇(3)

江門世貿(mào)廣場項目位于江門市東華路與迎賓路交匯處東南側(cè),上部結(jié)構(gòu)是鋼筋混凝土框架,剪力墻結(jié)構(gòu),設(shè)兩層地下室,基礎(chǔ)是預(yù)制鋼筋混凝土預(yù)應(yīng)力管樁基礎(chǔ)。基坑平面呈扇形,面積約為16980m2,周長約為650m,場地已挖土,移土整平,高程約為3.9~4.9m。按規(guī)劃要求,場地高程開挖前平整為2.8~3.3m,基坑底高程為-3.85m,基坑開挖深度為6.35~7.15m?;拥奈髂戏较?,地表下方埋設(shè)有一條重要管線,在對基坑監(jiān)測的同時需對管線的沉降和位移進(jìn)行監(jiān)測;基坑的東南方為一古廟,需監(jiān)測其在基坑施工過程中的整體沉降量。

2基坑變形監(jiān)測設(shè)計與實施

基坑的主要監(jiān)測項目由支護(hù)結(jié)構(gòu)樁頂位移、深層位移、支護(hù)結(jié)構(gòu)應(yīng)力、地下水位等項目組成。

2.1布設(shè)基準(zhǔn)點

布設(shè)基準(zhǔn)點的目的是在長期觀測過程中提供穩(wěn)定的起算數(shù)據(jù)。(1)位移基準(zhǔn)點應(yīng)布設(shè)在遠(yuǎn)離施工現(xiàn)場、結(jié)實穩(wěn)定的地方。水平位移監(jiān)測基準(zhǔn)點3個,工作基點3個,編號為J1~J6;(2)沉降基準(zhǔn)點的布設(shè)位置應(yīng)選在遠(yuǎn)離施工現(xiàn)場且穩(wěn)定的水泥路上。布設(shè)了3個水準(zhǔn)基準(zhǔn)點,編號為G1~G3。

2.2布設(shè)監(jiān)測點

監(jiān)測點的布設(shè)按施工設(shè)計圖要求,以能反映變形為宜。基坑監(jiān)測點在支護(hù)結(jié)構(gòu)樁后每隔20m左右布設(shè)一點,監(jiān)測點采用埋設(shè)觀測墩的形式。沉降、位移觀測點采用兩點合一布設(shè),即WY1-WY20,共20個。周邊建筑物沉降變形點布設(shè)在能反映建筑物沉降與傾斜的位置,如建筑物的四角、大轉(zhuǎn)角處、建筑物裂縫和沉降縫兩側(cè)。同時要求變形點埋設(shè)在建筑物的豎向結(jié)構(gòu)上,標(biāo)志采用“L”型鋼筋,共8個(M1-M8),周邊管線監(jiān)測點布設(shè)4個(GX3-GX6)。水位監(jiān)測點在基坑周邊布設(shè)5個(SW1-SW5),測點用地質(zhì)鉆鉆孔,孔深為10m。錨索應(yīng)力觀測點,按要求布設(shè)錨索應(yīng)力計12個,編號為MS1、MS2…MS12。支護(hù)結(jié)構(gòu)測斜觀測管按相關(guān)要求,布設(shè)測斜觀測管18個,編號為CX1、CX2、…CX18。

2.3監(jiān)測方法

沉降監(jiān)測使用天寶DINI03電子水準(zhǔn)儀和配套條碼銦鋼水準(zhǔn)尺進(jìn)行觀測。施測是以基準(zhǔn)點G1為起閉點,觀測所有的沉降點組成閉合水準(zhǔn)路線。采用“后、前、前、后”的觀測順序?qū)Τ两迭c進(jìn)行觀測。位移觀測使用徠卡TS30全站儀。在基準(zhǔn)點J1上設(shè)站,檢查J2、J4的方向和距離,檢查結(jié)果滿足規(guī)范要求后,以多測回測角法觀測每個監(jiān)測點,并進(jìn)行平差計算其坐標(biāo),然后計算出監(jiān)測坐標(biāo)在基坑邊橫向上的位移。深部位移使用測斜儀進(jìn)行監(jiān)測。監(jiān)測從孔底開始,每0.5m為一個測段,自下而上沿導(dǎo)管全長每一個測段固定位置測讀一次。地下水位使用電測水位計進(jìn)行監(jiān)測。

3監(jiān)測成果與分析

從2012年4月至2013年6月的14個月內(nèi)進(jìn)行了周邊建筑物沉降觀測,支護(hù)結(jié)構(gòu)沉降、位移監(jiān)測,管線沉降、位移監(jiān)測,地下水位監(jiān)測,錨索拉力監(jiān)測及深部位移監(jiān)測。本文主要對建筑物沉降、支護(hù)結(jié)構(gòu)樁頂位移、地下管線及深層位移的監(jiān)測結(jié)果進(jìn)行分析。

3.1建筑物沉降監(jiān)測

建筑物監(jiān)測是指對基坑周邊的華豐古廟進(jìn)行沉降觀測,華豐古廟周圍共有8個沉降監(jiān)測點,進(jìn)行了沉降觀測38期,監(jiān)測成果見表1,典型監(jiān)測點的沉降過程線。

3.2支護(hù)結(jié)構(gòu)樁監(jiān)測對基坑的支護(hù)結(jié)構(gòu)樁共布設(shè)了20個監(jiān)測點,進(jìn)行了沉降監(jiān)測37期,水平位移監(jiān)測29期,監(jiān)測成果見表2(對于水平位移,+號表示向基坑方向?qū)τ谥ёo(hù)結(jié)構(gòu)有兩個方向的形變,結(jié)合點位布設(shè)圖,對所有監(jiān)測點進(jìn)行分析發(fā)現(xiàn):垂直方向上,支護(hù)結(jié)構(gòu)向下沉降;水平方向上,整體有一個向東南方向位移的趨勢,即:基坑西北側(cè)的監(jiān)測點向基坑方向位移,東南側(cè)的監(jiān)測點則背向基坑方向位移。垂直方向和水平方向的累計變形量都比較小,且呈現(xiàn)出相似的形變過程,即前期變形波動較大,后期逐漸趨于平穩(wěn),且變形最大值小于預(yù)警值,故認(rèn)為支護(hù)結(jié)構(gòu)比較牢固,形變量都在比較安全的范圍內(nèi)。

3.3地下管線監(jiān)測

地下管線沉降量都比較大,沉降最小的GX6也有32.8mm,超過了預(yù)警值,最大的已達(dá)到120.1mm,遠(yuǎn)遠(yuǎn)超出了預(yù)警值。在發(fā)現(xiàn)沉降量較大之后,施工方采取了加固措施,后期管線沉降趨于穩(wěn)定?;邮┕芫€水平方向的位移也有一定影響,變形量較大的GX5位移量已超過預(yù)警值。施工初期管線沉降量增加較大的原因為:基坑開挖破壞了基坑土體原有的應(yīng)力平衡,引起臨近路面下沉,導(dǎo)致地下管線豎向移動,伴隨基坑開挖深度增加,管線的沉降量逐漸達(dá)到極限值,加之施工方采取了相應(yīng)的加固措施,使基坑施工中后期管線的沉降趨于穩(wěn)定。

3.4深部位移監(jiān)測

各監(jiān)測點的深部位移整體變形均較小,都低于預(yù)警值。深部位移主要有三種比較典型的變化情況:孔頂部和底部位移較小,中間位移較大;孔底部位移較小,頂部向背離基坑方向偏移;孔底部位移較小,頂部向基坑方向位移。CX9號測斜孔第30期(時間2013-1-10)在0~4.5m深處突然出現(xiàn)了一個較大的偏移,分析推測可能是由于鄰近監(jiān)測孔旁正在施工,施工過程造成了對表層土體的擠壓,因而引起了土體表層整體的較大位移。在隨后的幾期觀測中,該測斜孔位移趨于穩(wěn)定。深部位移監(jiān)測結(jié)果顯示,最大位移一般出現(xiàn)在孔頂部或6.5~8.5m處,最大位移量都在安全可控的范圍之內(nèi)。

4結(jié)論

篇(4)

 

因此,我們認(rèn)為案例研究作為一種重要研究策略的意義和潛在科學(xué)貢獻(xiàn)在國內(nèi)已經(jīng)廣為接受,不容質(zhì)疑。國內(nèi)案例研究者也普遍對案例研究的規(guī)范有了_定了解。佐證之一就是過去五屆案例論壇的論文質(zhì)量的大幅提升和學(xué)術(shù)影響的不斷擴大。在基本解決了案例研究的認(rèn)可和初步規(guī)范問題之后的此時,我們需要更多關(guān)注的是,案例研究是否提出了有趣的研究問題?數(shù)據(jù)分析過程是否足夠嚴(yán)謹(jǐn)?是否做出了應(yīng)有的理論貢獻(xiàn)?目前答案還并不十分肯定。

 

這些問題的答案在國外管理學(xué)界則相對比較肯定。構(gòu)建理論和檢驗理論被認(rèn)為是實證研究論文廣生理論貢獻(xiàn)的兩條根本途徑(ColquittandZapata-Phelan,2007)。國際頂尖管理學(xué)期刊之一AcademyofManagementJournal(AMJ)在1963~2007年近50年間發(fā)表的論文中,理論檢驗型和理論構(gòu)建型的論文數(shù)目都在逐年增長(ColquittandZapata-Phelan,2007)。理論構(gòu)建型研究通常指案例研究、扎根理論、民族志等歸納式研究,也包括假說演繹式的實證論文。理論構(gòu)建型論文雖然一直少于理論檢驗型論文,但差距越來越縮小,到2007年,兩者的數(shù)量幾乎接近。這一結(jié)論有力地證明了高水平國際期刊以及學(xué)者對包括案例研究在內(nèi)的定性研究的重視和支持然而,近5年來本土案例研究在哪些具體方面取得了明顯進(jìn)步?哪些方面還有待提高?為此,在對本屆案例論壇回顧之后,本文對近五屆論壇報告的研究型案例論文進(jìn)行比較分析,并針對目前存在的若干薄弱環(huán)節(jié)給出改進(jìn)步驟。

 

二、論壇的主要觀點和概況

 

本屆論壇邀請了美國阿拉巴馬大學(xué)JeffreyA.Martin教授等專家,為與會者帶來了精彩的學(xué)術(shù)報告。Martin教授具有豐富的案例研究經(jīng)驗,在攻讀博士學(xué)位期間師從KathleenEisenhardt教授,曾和StephenBarley和RobertSutton等著名案例研究專家一起工作過。他為論壇做了兩場主題報告,其要點主要包括以下幾個方面。

 

首先,Martin教授從一般定性研究入手,介紹了定性研究的幾種類型,特別強調(diào)定性數(shù)據(jù)的研究、歸納研究、比較案例研究、民族志、扎根理論等雖屬于不同類別的定性研究方法,但相互之間有重疊。在實際運用中,研究者常常組合運用這幾種研究類型,但如何組合,并沒有一個公認(rèn)的"模板"。這并不是說各種定性研究方法可以隨便地堆砌在_起,而是需要"協(xié)調(diào)"地結(jié)合在一起,以便得出更有意義的真理。Martin進(jìn)一步指出對定性研究而言:⑴分析層次可以是個體、團(tuán)隊和組織;(2)樣本規(guī)??梢允莀個、幾個或者許多個;⑶數(shù)據(jù)收集可以通過民族志、文檔或者面對面訪談;⑷數(shù)據(jù)分析的手段可以是歸納法、演繹法或者兩者相結(jié)合,可以用定性數(shù)據(jù)分析,也可以用定量的統(tǒng)計方法;(5)最后的理論模型可以是過程模型,也可以是因素模型,或者兩者的結(jié)合。事實上,案例論壇的稿件中也有一些是基于定性數(shù)據(jù)的研究但并非案例研究。Martin教授重點介紹了多案例比較研究,作為定性研究的—個主要類型。他以自己的研究為例,說明了從選擇研究問題、研究設(shè)計、數(shù)據(jù)收集和分析,到最后寫作和發(fā)表的全過程。

 

值得注意的是,在數(shù)據(jù)收集方面,Martin教授認(rèn)為,訪談時要使被訪者專注于敘述他們自己的所作所為,或親眼看到的其他人的行為。也就是說,應(yīng)該防止讓他們?nèi)ッ枋瞿切┧麄儗嶋H上并沒有參與的事情,例如在他們沒有參加的會議上發(fā)生了什么。此外,通常要避免提問"為什么"這樣的問題,因為找出事件背后的原因不是被訪者的任務(wù),而是研究者自己的工作(分析數(shù)據(jù)、解釋關(guān)系,從數(shù)據(jù)中推導(dǎo))。此外,數(shù)據(jù)收集需要花費大量的時間和精力,因此每次的數(shù)據(jù)收集工作應(yīng)能轉(zhuǎn)化為幾篇論文。

 

在數(shù)據(jù)分析方面,Martin教授認(rèn)為,所收集數(shù)據(jù)/證據(jù)的力度來源于跨案例之間的一致性,這就是所謂的復(fù)制邏輯。從相似的案例中找出相同的模式,能保證作者不會因為某個鮮活的特例而心猿意馬。

 

Martin教授特別強調(diào)了尋找能指導(dǎo)案例研究的理論的必要性。他認(rèn)為幾乎沒人能夠宣稱某個研究沒有現(xiàn)存理論依據(jù),文獻(xiàn)中總能找到一些相關(guān)理論,可在某種程度上應(yīng)用到數(shù)據(jù)分析中。因此,研究者應(yīng)該去探尋現(xiàn)有文獻(xiàn)的缺陷,而不能說沒有相關(guān)文獻(xiàn)。這樣做有兩重意義。首先,這能給讀者——我們的最初評審人個框架來理解我們的研究貢獻(xiàn);這也能幫助研究者更好地專注于自己想要做的貢獻(xiàn)。如果沒有聚焦,那么研究者就容易在自己的工作可能產(chǎn)生的眾多貢獻(xiàn)中搖擺不定,導(dǎo)致最終沒有完整地建立基于其中任何一個發(fā)現(xiàn)的理論。

 

新加坡國立大學(xué)的潘善琳(ShanLingPAN)教授做了題為"將企業(yè)實踐提煉為學(xué)術(shù)論文:結(jié)構(gòu)化、實用化、情景化(SPS)案例研究方法"的專題報告。丹麥哥本哈根商學(xué)院的李平(PeterPingLi)教授分享了其倡導(dǎo)的陰陽案例研究方法。他認(rèn)為案例研究是開展本土化研究所必需的重要研究方法之一,當(dāng)某個學(xué)術(shù)研究領(lǐng)域內(nèi)存在差異較大的理論觀點,特別是理論觀點相互沖突時,陰陽案例研究法非常適合研究人員創(chuàng)建整合式的新理論。

 

在案例教學(xué)方法模塊,廈門大學(xué)的沈藝峰教授剖析了案例教學(xué)的本質(zhì)。復(fù)旦大學(xué)的包季鳴教授提出案例教學(xué)要體現(xiàn)全球化背景下的中國特色、體現(xiàn)培養(yǎng)目標(biāo)的要求、體現(xiàn)學(xué)員的現(xiàn)實需求,通過即時性、進(jìn)行性、追蹤性案例來達(dá)到案例教學(xué)的效果。臺灣大學(xué)管理學(xué)院的李吉仁教授對案例教學(xué)的定位和現(xiàn)狀進(jìn)行了深入的分析。香港浸會大學(xué)MichaelYoung教授和中歐國際工商學(xué)院付莘研究員分享了教學(xué)案例寫作和課堂使用的經(jīng)驗和教訓(xùn)。

 

本屆案例論壇共收到來自海內(nèi)外94所院校的123篇稿件。經(jīng)過程序委員會的初篩和評審專家的"雙向匿名評審",最終收錄論文集65篇,其中研究型案例45篇,理論構(gòu)建研究論文13篇,教學(xué)型案例7篇。分論壇報告研究型案例23篇(實際錄取率為26%);理論構(gòu)建研究8篇;教學(xué)型案例7篇。論壇程序委員會的大部分成員以雙向匿名方式經(jīng)過兩輪投票排序,評選出9篇最佳論文(其中6篇研究型案例、3篇教學(xué)型案例)。

 

因篇幅關(guān)系,本文僅簡要介紹6篇獲獎研究型論文。其中周江華等(2011)通過多案例研究(7家企業(yè))深入剖析了我國山寨手機行業(yè)如何通過技術(shù)創(chuàng)新與商業(yè)模式創(chuàng)新在BoP(BottomofPyramid,金字塔底層)市場開展破壞性創(chuàng)新的過程。于天遠(yuǎn)和吳能全(2011)以珠三角地區(qū)的三家民營高科技企業(yè)為樣本,結(jié)合使用了深度訪談和問卷調(diào)查等方法,構(gòu)建了"組織文化變革模型”闡釋了"政商關(guān)系的非人格化水平"與組織文化變革歷程的關(guān)系。王世權(quán)等(2011)針對理論上關(guān)于母子公司關(guān)系網(wǎng)絡(luò)作用于子公司創(chuàng)業(yè)的內(nèi)在機理尚未理清的事實,對海信集團(tuán)及其主要的13家子公司的發(fā)展進(jìn)行了深入剖析,構(gòu)建了相關(guān)的理論模型。于春玲等(2011)以上海家化、云南白藥和晨光文具為研究對象,歸納出了中國情境下成功品牌延伸的影響因素及其相互關(guān)系。鄭曉明等(2011)基于雙元能力的理論視角,以海底撈公司發(fā)展歷程為案例研究對象,系統(tǒng)研究了促進(jìn)企業(yè)服務(wù)敏捷性形成的特征、過程和原因。王歡和湯谷良(2011)通過案例研究發(fā)掘了雙匯成功實施MBO的一系列要素,通過雙匯MBO"路徑創(chuàng)新"的典型案例驗證和補充了原有的MBO理論框架。

 

三、近5年案例研究論文規(guī)范性分析

 

這里,我們采用內(nèi)容分析法,運用毛基業(yè)和張霞(2008)借鑒Dub6和Par6(2003)的方法所歸納的案例研究規(guī)范性指標(biāo),來評估近五屆論壇報告的研究型案例論文的質(zhì)量。這套指標(biāo)便于"使得案例研究整個過程的每個步驟都在嚴(yán)格的控制下進(jìn)行,盡可能避免研究人員的隨意性和主觀性。這些嚴(yán)格的程序和標(biāo)準(zhǔn)是我們進(jìn)行案例研究時的參照,也可以用來評價一項案例研究是否達(dá)到了規(guī)范化要求〃(毛基業(yè)、張霞,2008,p.118)。

 

從數(shù)據(jù)分析結(jié)果來看,5年來論壇的研究型案例在各項規(guī)范性指標(biāo)上幾乎逐年提高。進(jìn)步最為明顯的方面包括明確的研究問題、說明相關(guān)理論、基于團(tuán)隊的研究、采用多種收集方法、引用原始證據(jù)。而有些方面相對仍然不足,特別是數(shù)據(jù)收集程序、數(shù)據(jù)分析過程,以及與現(xiàn)有理論的比較??紤]到有些規(guī)范性指標(biāo)是籠統(tǒng)的評價,為獲知更多的細(xì)節(jié)信息,以本屆論壇報告的論文為樣本,我們有如下進(jìn)一步的發(fā)現(xiàn)。

 

研究問題方面。研究問題可以具體說明研究者試圖想要知道或理解什么(Maxwell,2005),此外還起到兩個重要的作用:幫助研究者聚焦研究和指導(dǎo)實施研究(MilesandHuberman,1994)。可喜的是本屆論壇報告的案例中只有個別的沒有清楚表述其研究問題;但也有個別論文,雖然提出了研究問題,但過于發(fā)散。研究問題所引致的研究必須是真正可以實施的,也必須是讀者讀完研究論文之后能夠得到解答的問題(Maxwell,2005)。從這個意義上講,每個案例研究都應(yīng)該回答一個或若干具體研究問題,而這些問題最好在引言中就明確告訴讀者。

 

理論基礎(chǔ)方面。案例論壇_貫強調(diào)理論在案例研究中的重要性(毛基業(yè)、李曉燕,2010)。我們看到本屆論壇報告的每篇案例都對相關(guān)理論進(jìn)行了回顧,但也發(fā)現(xiàn)一些研究在指出缺乏對某現(xiàn)象的研究之后,所回顧的理論僅是走過場,沒有指出現(xiàn)

 

有理論能夠解釋哪些方面、缺口在哪里、為什么現(xiàn)有理論沒有對該現(xiàn)象給出滿意的解釋?案例研究的研究問題可以是理論驅(qū)動型,也可以是現(xiàn)象驅(qū)動型(EisenhardtandGraebner,2007)。對于那些由現(xiàn)象驅(qū)動的研究問題來說,研究者必須強調(diào)此現(xiàn)象的重要性和現(xiàn)有理論的貧乏(EisenhardtandGraeb-ner,2007)。

 

理論抽樣方面。數(shù)據(jù)收集的第一個步驟是確定數(shù)據(jù)來源,即案例對象的選擇。案例的選擇要符合理論抽樣(GlaserandStrauss,1967),而非統(tǒng)計抽樣。有些研究在確定研究對象時不太考慮案例與研究問題的匹配性,而是有選擇知名企業(yè)的傾向。

 

本屆論壇中案例對象更加多樣化、有趣和獨特,但是多數(shù)作者卻沒有清楚交代選擇該案例的理由,即沒有說明理論抽樣過程。

 

數(shù)據(jù)分析方面。樣本論文中多數(shù)作者都會交代自己的數(shù)據(jù)分析方法,但有些只是簡單交代了一下步驟。即使有些作者宣稱自己采用了扎根理論中的二步編碼法(StraussandCorbin,1998),或者是采用從經(jīng)典案例研究文獻(xiàn)中歸納出的其他數(shù)據(jù)分析方法,但讀者看到的只是機械的模仿,而沒有看到諸如以下信息:理論如何指導(dǎo)了作者的數(shù)據(jù)分析,數(shù)據(jù)分析過程中產(chǎn)生了哪些中間構(gòu)念和最終構(gòu)念(甚至要給出數(shù)量),構(gòu)念與構(gòu)念之間的關(guān)系是如何確立的。

 

與現(xiàn)有理論比較方面。案例研究的終極目標(biāo)是要構(gòu)建新的理論,理論構(gòu)建的一個特征是將涌現(xiàn)的概念、理論或假說同現(xiàn)有文獻(xiàn)進(jìn)行比較(Eisenhardt,1989)。樣本論文中有很多盡管理論回顧很到位、案例數(shù)據(jù)也很豐富、數(shù)據(jù)分析也很嚴(yán)謹(jǐn),但最后_步,只是匆匆做個總結(jié)便以此結(jié)束,以至于讀者無從知曉此案例研究到底產(chǎn)生了什么樣的理論貢獻(xiàn),例如對哪些現(xiàn)有理論進(jìn)行了修正或情境化。

篇(5)

關(guān)鍵詞:信用卡;信用卡數(shù)據(jù);信用卡業(yè)務(wù);數(shù)據(jù)分析

近年來,很多銀行為促進(jìn)信用卡業(yè)務(wù)發(fā)展投入了人財物力。截至目前,信用卡業(yè)務(wù)覆蓋了全國各地,發(fā)卡數(shù)量急劇擴張,設(shè)備裝機數(shù)量形成相當(dāng)?shù)囊?guī)模,產(chǎn)生了大量數(shù)據(jù)。這些數(shù)據(jù)有著重要作用,可以用來進(jìn)行客戶關(guān)系的管理,進(jìn)行風(fēng)險管理,分析收益,進(jìn)行績效評估,為銀行更好的發(fā)展業(yè)務(wù)提供有效的科學(xué)數(shù)據(jù)支持。通過數(shù)據(jù)分析,銀行能夠?qū)蛻暨M(jìn)行分類,針對不同群體的客戶實施不同的服務(wù)策略,為銀行卡的營銷提供準(zhǔn)確的數(shù)據(jù)信息。

1. 信用卡研究內(nèi)容及風(fēng)險類型

本課題主要從信用卡數(shù)據(jù)庫設(shè)計和總體技術(shù)兩個方面入手,以數(shù)據(jù)倉庫以及數(shù)據(jù)集市形成理論基礎(chǔ),通過企業(yè)目前具備的信息系統(tǒng)的發(fā)展現(xiàn)狀,用實際開發(fā)的項目與開發(fā)成果做指導(dǎo),闡述了我國某大型銀行在引用卡數(shù)據(jù)分析集市中在設(shè)計方面的價值實現(xiàn)。

隨身攜帶大量現(xiàn)金不僅不安全也十分麻煩,因此銀行設(shè)立了一項信用卡業(yè)務(wù),這也是一種信貸服務(wù)。信用卡通常是一張小小的塑料卡片,長、寬、厚都有固定的尺寸,小巧輕便,銀行或是發(fā)放信用卡的企業(yè)會根據(jù)持卡人的信譽與財富狀況派發(fā)此卡,利用信用卡可以在消費的時候免除現(xiàn)金,等到結(jié)賬的時候再一起還錢。除了一些和金融卡相關(guān)的信用卡,大部分的信用卡都與借記卡與提款卡有區(qū)別,其最顯著的特點就是不會直接扣除客戶賬戶的資金【1】。

2. 信用卡數(shù)據(jù)分析系統(tǒng)

銀行的信用卡管理信息系統(tǒng),以數(shù)據(jù)倉庫為基礎(chǔ),結(jié)合銀行的業(yè)務(wù)需求,通過對當(dāng)前存在的業(yè)務(wù)數(shù)據(jù)的分析,將主要的消費群體特征,如性別、年齡、學(xué)歷等呈現(xiàn)給管理人員,主要潛在的風(fēng)險人特征呈現(xiàn)給管理人員。本設(shè)計按照軟件工程的原理、對信用卡數(shù)據(jù)分析系統(tǒng)的系統(tǒng)需求,系統(tǒng)分析,系統(tǒng)設(shè)計,數(shù)據(jù)庫設(shè)計以及系統(tǒng)測試作了詳細(xì)的闡述,同時介紹了數(shù)據(jù)庫和asp和網(wǎng)頁設(shè)計基本知識,如何在實現(xiàn)網(wǎng)頁于數(shù)據(jù)庫的連接,如何存取數(shù)據(jù)等。本系統(tǒng)的主要功能模塊包括:用戶管理模塊、效益分析模塊、風(fēng)險管理模塊。其中風(fēng)險管理模塊提供了圖形報表功能,為系統(tǒng)使用者提供了更為直觀的數(shù)據(jù)信息,使用戶能夠輕松地使用系統(tǒng)【2】。

2.1信用卡數(shù)據(jù)來源的多元化

目前辦理和使用信用卡已經(jīng)十分頻繁,國內(nèi)的信用卡業(yè)務(wù)的信息管理包括了進(jìn)件、客戶收單、客戶服務(wù)及催收等多個子系統(tǒng),將這些系統(tǒng)與外部數(shù)據(jù)相連就可以具備諸如個人征信等功能。然而,各個子系統(tǒng)之間并沒有形成內(nèi)在聯(lián)系,就連格式與編碼都明顯不同,數(shù)據(jù)分析的難度很大【3】。因此對數(shù)據(jù)進(jìn)行規(guī)范和統(tǒng)一迫在眉睫。

2.2 信用卡數(shù)據(jù)的關(guān)聯(lián)和整理

客戶的年齡、性別、收入狀況、授信額度等構(gòu)成了客戶的基本信息,這些信息之間的關(guān)聯(lián)性會影響到客戶的消費狀態(tài),反之也一樣,客戶的消費也會影響授信額度。所以,子系統(tǒng)之間是有緊密的數(shù)據(jù)聯(lián)系的。比如,風(fēng)控部門時不時檢查一下客戶的消費狀態(tài),分析將會產(chǎn)生的消費行為,從各個系統(tǒng)的數(shù)據(jù)關(guān)聯(lián)、整合起來獲得客戶的全面資料,反饋到市場部,以致決策者做出積極的決策。

2.3 信用卡數(shù)據(jù)量龐大

當(dāng)今,越來越多的人使用信用卡,隨之而來的則是客戶數(shù)量、交易額度、授權(quán)記錄等的陡然增加,這時候就需要用到針對個人賬戶、客戶、交易的大批量數(shù)據(jù)操作的信用卡分析了。本課題利用我國一個大型國有銀行作為調(diào)查對象,發(fā)現(xiàn),這一銀行的信用卡用戶有一千八百萬,交易額每天能達(dá)到八十萬,還有一些積分、通訊等業(yè)務(wù),況且還有預(yù)留數(shù)據(jù)分析的時間,因此數(shù)據(jù)分析效率問題就凸顯出來。

3. 信用卡數(shù)據(jù)分析平臺

怎樣在許多數(shù)據(jù)源中,建立一個實用、高效的數(shù)據(jù)分析平臺系統(tǒng)是現(xiàn)在國內(nèi)信用卡行業(yè)最想解決也是最難解決的一項研究。

數(shù)據(jù)分析平臺是以應(yīng)用于報表類和數(shù)據(jù)挖掘類兩種數(shù)據(jù)分析

為目的,分析企業(yè)如今的信息數(shù)據(jù)系統(tǒng)以及業(yè)務(wù)發(fā)展的需要,研究數(shù)據(jù)分析平臺的規(guī)劃特征,這樣就可以實現(xiàn)一個設(shè)計完善的數(shù)據(jù)倉庫及數(shù)據(jù)分析集市和生產(chǎn)環(huán)境的信息分析集市。

4. 信用卡數(shù)據(jù)架構(gòu)的設(shè)計和實現(xiàn)

信用卡數(shù)據(jù)以信用卡數(shù)據(jù)分析的獨特特點,建立一個實用、高效、現(xiàn)代化的靈活的信用卡分析集市,而且也在銀行中實踐驗證成功,這一次的驗證也是這一銀行首次有了信用卡數(shù)據(jù)分析集市。相對于傳統(tǒng)的信用卡管理方式來說,有以下幾個方面的優(yōu)點:

1、通過對信用卡相關(guān)的6大信息系統(tǒng)源數(shù)據(jù)的關(guān)聯(lián)和整合,極大豐富而又全面了許多數(shù)據(jù)源,其中有進(jìn)件、催收、交易、電話服務(wù)、收單以及積分等多個系統(tǒng),也實現(xiàn)了整體化的數(shù)據(jù)分析整合。

2、為了讓信用卡的數(shù)據(jù)可以融合edw,讓企業(yè)信息保持一致與完整,需要針對edw的數(shù)據(jù)模型進(jìn)行擴充,尤其是要新增4個主題域信用卡相關(guān)實體。因此,改造原架構(gòu),變更為系統(tǒng)更易于擴充整合新的源系統(tǒng)―企業(yè)數(shù)據(jù)倉庫―數(shù)據(jù)分析集市這三方面的數(shù)據(jù)源系統(tǒng),如此也就能讓信用卡的數(shù)據(jù)分析平臺得到更為全面的數(shù)據(jù)支持,從而降低數(shù)據(jù)分析的成本。

3、數(shù)據(jù)結(jié)構(gòu)需要面向數(shù)據(jù)分析優(yōu)化設(shè)計。為實現(xiàn)在海量數(shù)據(jù)(l0tb)級別的成功運行,必須要以分析信用卡的可能風(fēng)險、財務(wù)會計、服務(wù)渠道與市場狀況等為先決條件,要實現(xiàn)信用卡可以靈活報表、多層次統(tǒng)計與挖掘數(shù)據(jù),讓匯總層數(shù)據(jù)的設(shè)計更加出色,才能使其有充分?jǐn)U展的可能性。

而基礎(chǔ)層、匯總層、應(yīng)用層3大層次構(gòu)成了從數(shù)據(jù)源到應(yīng)用數(shù)據(jù)流向的數(shù)據(jù)分析集市系統(tǒng)。其中,企業(yè)數(shù)據(jù)倉庫整合來自各個源系統(tǒng)的數(shù)據(jù)主要用到其基礎(chǔ)層來存儲細(xì)節(jié)和歷史數(shù)據(jù)。而數(shù)據(jù)集市,支持應(yīng)用層與數(shù)據(jù)挖掘一同到匯總層。這因為如此,使多方面靈活分析報表中更多的用到應(yīng)用層。星形模型與規(guī)劃、反規(guī)劃漸漸匯總形成三層次的結(jié)構(gòu)特點。而不同的數(shù)據(jù)粒度需要各個層次在內(nèi)部對主題域及實體進(jìn)行合理的規(guī)劃,這樣才能滿足多層次需求。

5. 結(jié)語

迄今,發(fā)達(dá)國家的信用卡業(yè)數(shù)據(jù)分析手段多樣且先進(jìn),數(shù)據(jù)來源全面而豐富,同時也存在不少問題,尤其是在美國的金融機構(gòu)中,因為欠缺一體的制度,就無法形成統(tǒng)一、方便、高效率的信息分析系統(tǒng),也沒有可供進(jìn)行分析的數(shù)據(jù)庫、受到普遍認(rèn)可的共同指標(biāo)以及可以共享信息的平臺等。一般會形成各部門、小組及個人之間互不干涉,數(shù)據(jù)庫的來源地、衡量標(biāo)準(zhǔn)各不相同,研究報告時有重復(fù)缺乏全面,有時更是互相矛盾。這些都是我國目前信用卡數(shù)據(jù)分析常見的問題,這也是今后需要避免和解決的問題。

參考文獻(xiàn):

[1] 穆欣欣 . 中美銀行信用卡業(yè)務(wù)之比較分析 [期刊論文] -經(jīng)濟(jì)師2011(7)

篇(6)

近半個世紀(jì)以來,科學(xué)技術(shù)迅猛發(fā)展,新知識、新成果不斷涌現(xiàn),數(shù)字化特點凸顯。根據(jù)2002年度美國國家科學(xué)基金會資助的研討會報告,目前我們收集的數(shù)據(jù)需求呈指數(shù)增長,而數(shù)據(jù)分析的需求呈二次增長,但統(tǒng)計的專業(yè)人才呈線性增長并且目前統(tǒng)計學(xué)的教育遠(yuǎn)遠(yuǎn)落后于實際需求。邵啟滿教授“給當(dāng)今畢業(yè)生的建議,就兩個字:統(tǒng)計”。我們當(dāng)前的數(shù)理統(tǒng)計課程的教育還處于“非常狹窄的計算機時代前的統(tǒng)計學(xué)”,嚴(yán)重滯后于不斷發(fā)展中的現(xiàn)代統(tǒng)計學(xué)。大部分的研究生教科書內(nèi)容仍然是從統(tǒng)計量到點估計,繼而假設(shè)檢驗、回歸分析和方差分析等基礎(chǔ)知識的呈現(xiàn)及統(tǒng)計方法的推導(dǎo)。課程的教學(xué)大綱中也以理論推導(dǎo)為重點,注重統(tǒng)計方法的理論基礎(chǔ)和演繹證明,而對于實際應(yīng)用較多的現(xiàn)代統(tǒng)計方法缺乏介紹,忽視與各種統(tǒng)計軟件的結(jié)合。因此,我國工科研究生畢業(yè)論文實驗數(shù)據(jù)處理手段較為低級,對異常數(shù)據(jù)缺乏理性說明。我們的研究生往往在學(xué)完數(shù)理統(tǒng)計課程后,雖然掌握了基本的統(tǒng)計方法和推導(dǎo),但進(jìn)入科研工作碰到實際數(shù)據(jù)時,對數(shù)據(jù)的收集、處理和分析仍然一籌莫展。這也是促使我們教學(xué)理念轉(zhuǎn)換的主要原因,研究生數(shù)理統(tǒng)計課程應(yīng)以現(xiàn)代統(tǒng)計應(yīng)用為中心,不僅要求學(xué)生理解和領(lǐng)會統(tǒng)計思想,還應(yīng)正確使用統(tǒng)計方法,根據(jù)計算結(jié)果作出正確的推斷,給出合理的解釋。

2教學(xué)變革的嘗試

由于課程的實用性和重要性,學(xué)生普遍對數(shù)理統(tǒng)計課程比較感興趣。如何調(diào)動學(xué)生的主觀能動性,變“被動灌輸”為“主動探索”,在有限的課時內(nèi)學(xué)習(xí)較多的統(tǒng)計知識呢?我們教學(xué)變革主要采取如下措施。

2.1教學(xué)內(nèi)容的調(diào)整為了避免重復(fù)學(xué)習(xí),我們對原來本科時已經(jīng)學(xué)習(xí)的統(tǒng)計量與抽樣分布、參數(shù)估計這部分內(nèi)容只簡單復(fù)習(xí),溫故知新,不再細(xì)講。而對目前生物醫(yī)學(xué)工程中應(yīng)用較普及的方差分析、回歸分析,我們補充了生物醫(yī)學(xué)方面的實例,運用軟件進(jìn)行統(tǒng)計分析,并對運行結(jié)果詳細(xì)講解。對于教材未介紹的非參數(shù)檢驗和實驗設(shè)計部分,補充幾種常見的統(tǒng)計方法。對于較復(fù)雜的多元統(tǒng)計和現(xiàn)代統(tǒng)計學(xué)部分,我們引入PBL教學(xué)模式,通過分組、問題探究、成果匯報、反思和完善幾個步驟,完成學(xué)習(xí)內(nèi)容。

2.2教學(xué)方式的改進(jìn)在課程的教學(xué)中,我們盡量做到深入淺出,回避復(fù)雜的推導(dǎo)、運算和證明,強調(diào)對統(tǒng)計思想的理解以及統(tǒng)計方法的運用,同時注重和統(tǒng)計軟件的結(jié)合。統(tǒng)計從某種意義上說是與數(shù)據(jù)打交道的科學(xué),沒有實際數(shù)據(jù)的統(tǒng)計分析,不利于學(xué)生對統(tǒng)計方法的理解和應(yīng)用。教學(xué)中如果仍然當(dāng)成數(shù)學(xué)課程,注重統(tǒng)計理論中定理和公式的推導(dǎo)演算,而缺乏實際的數(shù)據(jù)分析訓(xùn)練,學(xué)生就無法對統(tǒng)計的廣泛應(yīng)用性及重要性有深刻的體會,也不利于保持和提高他們的學(xué)習(xí)興趣。我們補充了生物醫(yī)學(xué)方面的實例,通過數(shù)據(jù)分析,提高他們對統(tǒng)計方法的實際應(yīng)用能力,也為后續(xù)PBL教學(xué)的順利開展做準(zhǔn)備。大部分學(xué)生在本科階段已學(xué)習(xí)Matlab軟件,而且工科學(xué)生計算機應(yīng)用能力較強,因此我們要求學(xué)生自學(xué)一門統(tǒng)計軟件(如SPSS、R等)或使用Mat-lab,對所有的實例在軟件中實現(xiàn)數(shù)據(jù)分析。軟件輸出的是數(shù)值或圖表,并沒有詳細(xì)的解釋、分析和結(jié)論,學(xué)生必須結(jié)合數(shù)據(jù)背景知識,應(yīng)用所學(xué)統(tǒng)計方法,進(jìn)行分析推斷,最后給出結(jié)論和合理的解釋。

2.3考核方案的變革注重平時考核,淡化期末考試。考試不是最終目的,只是促進(jìn)學(xué)習(xí)而已。因此,成績是對學(xué)生學(xué)習(xí)情況的全面評價,不僅包括教材知識點的掌握情況,還有自主學(xué)習(xí)和實際應(yīng)用的能力。我們將PBL案例分析的評價和期末考試的成績各設(shè)置為50%的比例,鼓勵學(xué)生自主學(xué)習(xí),提高實際數(shù)據(jù)分析的能力。

3結(jié)合PBL教學(xué)模式

統(tǒng)計學(xué)的飛速發(fā)展要求研究生掌握必備的統(tǒng)計基礎(chǔ)知識外,能夠進(jìn)行知識的自我更新,具有不斷學(xué)習(xí)現(xiàn)代統(tǒng)計新知識的能力。PBL教學(xué)模式在提高學(xué)生分析問題、解決問題的能力,培養(yǎng)學(xué)生成為自主學(xué)習(xí)者、終身學(xué)習(xí)者等方面已被廣泛認(rèn)同。雖然生物醫(yī)學(xué)工程專業(yè)研究生基礎(chǔ)知識比較扎實,但統(tǒng)計學(xué)的發(fā)展以及軟件的學(xué)習(xí)交叉,要想學(xué)好這門課程并不輕松。在研究生教班開展PBL教學(xué)的有利條件是:①教班人數(shù)較少,分組進(jìn)行問題探索可以實現(xiàn)。②學(xué)生對數(shù)理統(tǒng)計課程比較感興趣,積極性較高。③現(xiàn)代統(tǒng)計學(xué)和計算機科學(xué)緊密聯(lián)系,但醫(yī)學(xué)工程學(xué)生計算機應(yīng)用能力較強,在統(tǒng)計軟件的學(xué)習(xí)和編程方面具有優(yōu)勢。④教研組在數(shù)模競賽培訓(xùn)和本科畢業(yè)設(shè)計中積累了一些素材,可以將內(nèi)容完善成PBL問題。我們引入PBL教學(xué)模式,進(jìn)行了初步探索。

3.1前期準(zhǔn)備推薦一些統(tǒng)計應(yīng)用的網(wǎng)站和書籍。簡單介紹前沿的方法和知識,補充回歸、相關(guān)、時間序列分析以及實驗設(shè)計等內(nèi)容,對于隨機模擬、MC-MC方法也舉例說明。教師將原先積累了一些實例設(shè)計成若干問題,讓學(xué)生進(jìn)行選題,組成學(xué)習(xí)小組(每組5-8人),確定分工。我們將多元統(tǒng)計分析和傳染病預(yù)測的案例編寫成4個問題,提前半個月交給學(xué)生,等他們分組確定后,分別給予一定指導(dǎo)。

3.2問題探究小組成員分工合作,查找文獻(xiàn)、學(xué)習(xí)算法,圍繞選定的問題進(jìn)行準(zhǔn)備。通過交流和討論,將各自學(xué)到的知識進(jìn)行整合,進(jìn)而運用這些知識重新分析上一階段提出的問題,思考并提出解決方案。最后,對問題形成一個附有詳細(xì)統(tǒng)計算法和計算結(jié)果的論文報告交給教師。

3.3成果展示和匯報各組將問題的解決方案和結(jié)果做成PPT,在課堂上進(jìn)行匯報。其他小組可以提問和質(zhì)疑,開展課堂討論。教師預(yù)先閱讀各小組的論文報告,引導(dǎo)學(xué)生的課堂討論,針對學(xué)生模糊不清的問題進(jìn)行講解,強調(diào)重點和難點,對每個小組的報告給予建設(shè)性意見和評價。

篇(7)

信息時代,數(shù)據(jù)儼然已成為一種重要的生產(chǎn)要素,如同資本、勞動力和原材料等其他要素一樣,而且作為一種普遍需求,它也不再局限于某些特殊行業(yè)的應(yīng)用。各行各業(yè)的公司都在收集并利用大量的數(shù)據(jù)分析結(jié)果,盡可能的降低成本,提高產(chǎn)品質(zhì)量、提高生產(chǎn)效率以及創(chuàng)造新的產(chǎn)品。大數(shù)據(jù)無處不在

“大數(shù)據(jù)開啟了一次重大的時代轉(zhuǎn)型。就像望遠(yuǎn)鏡讓我們能夠感受宇宙,顯微鏡讓我們能夠觀測微生物一樣,大數(shù)據(jù)正在改變我們的生活以及理解世界的方法,成為新發(fā)明和新服務(wù)的源泉,而更多的改變正蓄勢待發(fā)……”互聯(lián)網(wǎng)專家維克托·邁爾一舍恩伯格在《大數(shù)據(jù)時代》一書中這樣描述大數(shù)據(jù)。在這個時代大數(shù)據(jù)無處不在。Gartner公司的分析師聲稱信息量每年正以最少59%速度在遞增。IDC最新的數(shù)字宇宙(DigitalUniverse)研究估計,到2020年世界上的數(shù)據(jù)存儲總額將達(dá)到35 ZB(zettabytes)(lzettabyte等于一萬億GB字節(jié))。

信息爆炸讓數(shù)據(jù)像空氣那樣無處不在。和朋友一起吃飯,對新上桌的美味進(jìn)行拍照,上傳到自己SNS賬號與更多的人分享。這個過程在產(chǎn)生大數(shù)據(jù);在淘寶上購物,選擇中意的物品,填寫送貨地址,點擊確定,進(jìn)入付款頁面,選擇付款銀行付款,這個過程也在產(chǎn)生大數(shù)據(jù)。工廠機器的GPS數(shù)據(jù)、維修記錄等也是大數(shù)據(jù),產(chǎn)品銷售記錄、客戶行為習(xí)慣資料等也是大數(shù)據(jù);礦山、氣象等資料也是大數(shù)據(jù);平安城市計劃中的物聯(lián)網(wǎng)更是大數(shù)據(jù)。

大數(shù)據(jù)來自無所不在的IT設(shè)施,人人成為了數(shù)據(jù)制造者:短信、微博、照片、錄像、可穿戴設(shè)備產(chǎn)生的信息都是數(shù)據(jù);數(shù)據(jù)來自無數(shù)自動化傳感器、自動記錄設(shè)施,生產(chǎn)監(jiān)測、環(huán)境監(jiān)測、交通監(jiān)測、安防監(jiān)測等等;來自自動流程記錄:刷卡機、收款機、ETC、互聯(lián)網(wǎng)點擊、電話撥號等設(shè)施以及各種辦事流程登記等。大量自動或人工產(chǎn)生的數(shù)據(jù)通過互聯(lián)網(wǎng)聚集到特定地點,如電信運營商、互聯(lián)網(wǎng)運營商、政府、銀行、商場、企業(yè)、交通樞紐等機構(gòu),形成了大數(shù)據(jù)之海。總之,你信或不信,大數(shù)據(jù)就在我們身邊。

數(shù)據(jù)分析才是關(guān)鍵所在

擁有大數(shù)據(jù)并不是我們的目的,我們的目的是從這些數(shù)據(jù)中了解真實信息,使數(shù)據(jù)能夠真正在管理、決策、監(jiān)測、評價,以及人們的生活中產(chǎn)生價值。大數(shù)據(jù)分析上可影響國家政治,沒有大數(shù)據(jù)分析奧巴馬就不會贏得美國總統(tǒng)大選;下可改變我們的日常生活,就連追女孩子都可以使用大數(shù)據(jù)分析的方法來制定策略。

“面對海量數(shù)據(jù),誰能更好地處理、分析數(shù)據(jù),誰就能真正搶得大數(shù)據(jù)時代的先機?!边@幾乎是業(yè)界所有人的共識。對海量數(shù)據(jù)的分析已經(jīng)成為了企業(yè)、政府非常重要且迫切的需求。在數(shù)據(jù)分析方面的能力將決定企業(yè)市場份額的得失、政府決策能力的高低。大數(shù)據(jù)分析讓IT有機會增加價值,增進(jìn)業(yè)務(wù)部門間的關(guān)系,增加收入和提高利潤。

大數(shù)據(jù)分析對醫(yī)療行業(yè)的發(fā)展非常重要。醫(yī)療行業(yè)早就遇到了海量數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)的挑戰(zhàn),大數(shù)據(jù)分析技術(shù)的發(fā)展讓這些數(shù)據(jù)的價值得以充分發(fā)揮,其中,基因組學(xué)是大數(shù)據(jù)在醫(yī)療行業(yè)的經(jīng)典應(yīng)用。以云計算為基礎(chǔ)的大數(shù)據(jù)分析技術(shù)不僅加速了基因序列分析的速度,也讓其成本不斷減低。

經(jīng)濟(jì)的快速發(fā)展促使城市機動車輛大幅度增加,傳統(tǒng)的交通系統(tǒng)已難以滿足當(dāng)前復(fù)雜的交通需求,交通堵塞成為城市的通病。隨著交通信息化與交通規(guī)劃的融合程度越來越高,大數(shù)據(jù)發(fā)揮的功能和信息獲取渠道都將更加廣泛。中國城市交通研究中心吳洪洋博士表示,公交刷卡數(shù)據(jù)挖掘、出租車軌跡挖掘、手機數(shù)據(jù)挖掘、社會化網(wǎng)絡(luò)數(shù)據(jù)挖掘?qū)⒊蔀槲磥泶髷?shù)據(jù)應(yīng)用的主要方向。

大數(shù)據(jù)分析技術(shù)加速制造業(yè)從傳統(tǒng)的以生產(chǎn)為核心向客戶需求為核心轉(zhuǎn)型。在大數(shù)據(jù)分析技術(shù)的驅(qū)動下,一些制造業(yè)的企業(yè)開始轉(zhuǎn)向與訂單用戶或者最終消費客戶群進(jìn)行直接的互動。通過更透明、更可用的數(shù)據(jù),企業(yè)可以釋放更多蘊含在數(shù)據(jù)中的價值。實時、有效的數(shù)據(jù)可以更好的幫助企業(yè)提高產(chǎn)品品質(zhì)、降低生產(chǎn)成本。企業(yè)領(lǐng)導(dǎo)者也可根據(jù)真實可靠的數(shù)據(jù)制訂正確戰(zhàn)略經(jīng)營決策,實現(xiàn)企業(yè)效益最大化。

破解密碼——Hadoop

數(shù)據(jù)的非結(jié)構(gòu)化已經(jīng)成為企業(yè)的重大挑戰(zhàn)。由于這些數(shù)據(jù)的結(jié)構(gòu)問題及大數(shù)據(jù)類型的復(fù)雜關(guān)聯(lián),導(dǎo)致無法應(yīng)用現(xiàn)有的傳統(tǒng)技巧進(jìn)行大數(shù)據(jù)分析。這為企業(yè)帶來了新的任務(wù),需要開發(fā)一套全新方法,不僅能夠處理傳統(tǒng)數(shù)據(jù),而且可以便捷地分析和應(yīng)用這些新興數(shù)據(jù)。Hadoop恰恰可以滿足大數(shù)據(jù)分析這種需求。

Hadoop已成為公認(rèn)的新一代大數(shù)據(jù)處理平臺。Hadoop是一個能夠?qū)Υ罅繑?shù)據(jù)進(jìn)行分布式處理的軟件框架。它以谷歌的MapReduce及谷歌文件系統(tǒng)技術(shù)研究論文為基礎(chǔ)。Hadoop充當(dāng)著眾多“大數(shù)據(jù)”分析工具的底層技術(shù),旨在對由web訪問、服務(wù)器日志及其它各類數(shù)據(jù)流所產(chǎn)生的海量數(shù)據(jù)進(jìn)行篩選,在分布式環(huán)境下提供海量數(shù)據(jù)的處理能力。

Hadoop是以一種可靠、高效、可伸縮的方式進(jìn)行處理的。它以計算元素和存儲會失敗為前提,維護(hù)多個工作數(shù)據(jù)副本,確保能夠針對失敗的節(jié)點重新分布處理。Hadoop以并行的方式工作,通過并行處理加快處理速度,能夠處理PB級數(shù)據(jù)。此外,Hadoop依賴于社區(qū)服務(wù)器,所以它又具有低成本的優(yōu)點。

目前,幾乎所有的主流廠商都提供了基于Hadoop的大數(shù)據(jù)分析工具。如IBM、EMc、英特爾、甲骨文等都紛紛投入到Hadoop懷抱。

IBM很早就開始在實驗室嘗試使用Hadoop,但是,直到2012年才推出了首款大數(shù)據(jù)分析產(chǎn)品:IBM InFoSphereBigInsights。該產(chǎn)品既可以分析數(shù)據(jù)庫中的傳統(tǒng)結(jié)構(gòu)化數(shù)據(jù),也可以分析例如文本、視頻、音頻、圖像、社交媒體、點擊流、日志文件、天氣數(shù)據(jù)等非結(jié)構(gòu)化數(shù)據(jù),幫助決策者根據(jù)數(shù)據(jù)迅速采取行動。

EMC基于Hadodp的發(fā)行版PivotalHDs可以讓數(shù)據(jù)團(tuán)隊和分析團(tuán)隊在該平臺上無縫共享信息、協(xié)作分析。其最大的優(yōu)勢是能夠與Greenplum數(shù)據(jù)庫進(jìn)行整合,而不僅僅是在Hadoop中運行SQL這么簡單。

英特爾推出的Hadoop發(fā)行版不但改寫了Hadoop框架的核心功能,強化對處理器指令集的支持來提高效能,可直接支持Xeon進(jìn)階運算加密指令集AES-NI.并在數(shù)據(jù)儲存到HBase的過程。用芯片原生的加密功能保護(hù),這是英特爾進(jìn)軍大數(shù)據(jù)的殺手锏軟件。