欧美麻豆久久久久久中文_成年免费观看_男人天堂亚洲成人_中国一级片_动漫黄网站免费永久在线观看_国产精品自产av一区二区三区

中培偉業IT資訊頻道
您現在的位置:首頁 > IT資訊 > 大數據 > 非結構化數據的元數據管理

非結構化數據的元數據管理

2018-04-28 10:19:50 | 來源:中培企業IT培訓網

5.4  非結構化數據的元數據管理

由于非結構化數據的類型和表現形式多樣,其元數據管理辦法很難統一,并且非結構化數據的內容不確定、不易獲取(如影音、視頻),因此其元數據的提取和管理在業界還是一個新領域。在此,僅就幾類非結構化數據進行元數據管理方法的初步探討。

1)對于影音、視頻、圖片等形式的非結構化數據,其內容一般較難獲取,因此根據前面介紹的四面體模型來管理這類非結構化數據的元數據。數據生成或獲取時明確其語義特征、基本屬性、底層特征三方面屬性,可以將其抽離出來作為結構化數據存儲,那么就可以按照結構化數據的元數據管理方法進行管理。

2)對于網頁、文檔等,不僅可以獲取語義特征、基本屬性、底層特征等屬性作為元數據,還可以從其中對其內容進行讀取解析,抽取出關鍵字,作為非結構化數據的標簽。主要分為三種類別:

第一種是提取文章里的關鍵詞,作為主題詞標簽元數據。

第二種是對文章進行多個維度的分類,打上分類標簽,如在輿情分析過程中,會打上文章所涉及的銀行、產品及業務、風險點、正負面情感等。

第三種是文章本身的結構化標簽元數據,如時間、作者、來源、大小等。

在實現過程中,只有通過分詞、文本去重、各類分析模型(如主題分析模型、分類模型、情感分析模型)處理,并輔以各種自動化訓練手段,才能獲取網頁、文檔等各類文本的非結構化數據的標簽元數據。

3)對于具有加密方式的非結構化數據,要獲取其內容,一般需要比較高級的權限,因此在對其進行管理時只能獲取基本的語義特征、基本屬性,即可以知道文檔的名稱、時間等,而對于其內容則無法獲知,一般和影音、視頻、圖片的相關元數據管理方法類似。

標簽: 元數據管理
主站蜘蛛池模板: 内射极品少妇一区二区AV | 麻豆国产在线精品国偷产拍 | 老司机午夜免费福利视频 | 内射精品无码中文字幕 | 夜夜爽爽爽 | java性无码hd中文 | 免费无码AV一区二区 | 欧美a级成人网站免费 | 亚洲精品无码高潮喷水A片小说 | 古代春交性姿势K8 | 精品无码AV在线观看 | 欧美综合精品久久久久成人影院 | 亚洲精品无码高潮喷水A片 无码动漫性爽xo视频在线 | 色妺妺视频网 | 日本打屁股调教免费网站 | 久久久国产精品一区二区18禁 | 国产无遮挡a片又黄又爽 | 国产成人欧美一区二区三区 | 国产毛片女人高潮叫声 | 最新国自产拍av | 一出一进一爽一粗一大视频免费的 | 成人无码WWW在线看免费 | 日日摸日日碰夜夜爽亚洲 | 亚洲色欲色欲www在线丝 | 欧美三级韩国三级日本三斤 | 亚洲av日韩av天堂影片精品一 | 中文字幕无码日韩专区免费 | 日本少妇被爽到高潮动态图 | 在线天堂资源WWW在线污 | 久久精品午夜福利 | 欧美性生交活XXXXXDDDD | 亚洲日本乱码一区二区产线一∨ | 美女视频很黄很a免费国产 视频一区 中文字幕 | 香蕉欧美成人精品A∨在线观看 | 99国产精品欧美久久久久的广告 | 五月婷久久综合狠狠爱97 | 国产欧洲精品自在自线官方 | 亚洲av午夜成人片动漫番 | 亚洲最大AV无码网站 | 蜜桃视频在线观看免费网址入口 | 日本WWW一道久久久免费榴莲 |