Data Management in Fog Computing

Understand data management in fog computing

Featured image

ReadMe

아래 내용은 Rajkumar Buyya, Satish Narayana Srirama 저서인 For and Edge Computing: Principles and Paradigms 책의 내용을 주로 다루고 있습니다.

Motivation

포그 컴퓨팅은 IoT에 대한 거대하고 실시간으로 이뤄지는 데이터 관리 시스템에 대한 중요한 역할을 하고 있습니다. 센서와 디바이스들은 주기적으로 데이터들을 생성하지만 그 데이터에는 불필요하고 노이즈이거나 반복적인 데이터들이 존재합니다. 그럼에도 불구하고 에러, 패킷로스, 데이터 밀집에서 생기는 누락 등을 알기위해 데이터 전송을 해야합니다. 그러다보니 각 IoT 디바이스에서 생기는 데이터 누락과 자원의 제약의 이유로 프로세싱과 생성된 데이터의 저장들에 캐파가 부족한 실정입니다.

포그 컴퓨팅 패러다임에서 엔드 디바이스에 가깝게 저장(Storing), 처리(Preocessing), 네트워크(Network)를 가져오는 것에 적절한 솔루션을 고려해야 합니다. 포그 컴퓨팅은 암호화와 암호 해독, 데이터 융합, 종속성, 로드밸런싱을 제공하면서 온-사이트 처리와 저장(on-site processing and storage)을 좀 더 프라버시하게 활성화합니다.

Advantages of data management in for computing

포그는 디바이스와 클라우드 단 사이에 존재하는 중개자 역할이고 임시데이터 저장(temporary data storage), 예견된 처리(preliminary processing) 그리고 데이터 해석(analytics)을 담당하고 있습니다.

데이터 관리, 처리, 가상화, 그리고 서비스 프로비져닝은 모두 포그 레이어에서 끝납니다. 예를들면 Foglet은 포그 서버들과 포그 엣지단 사이에 인터페이스하면서 미들웨어의 역할인 소프트웨어 에이전트입니다. 이것은 또한 모니터링, 제어, 유지보수로 사용됩니다. 포그 데이터 관리는 데이터 핸들링과 연관이 있습니다. 예를 들면 데이터 집합 방법론, 데이터 필터링 기술, 데이터 배치, 데이터 보안성 제공(data agreegation approaches, data filtering techniques, data placement, providing data privacy)이 있죠. 좀 더 명확하게 나눠보겠습니다.



Fog Data Life Cycle

포그 데이터의 라이프 사이클은 1) Data Acquisition 2) Lightweight Processing 3) Processing and Analysis 4) Sending Feedback 5) Command Execution 으로 나뉩니다. 엣지 컴퓨팅은 포그, 클라우드도 중요하지만 데이터 들의 특성들때문에 더 높은 기술로 인정받고 있는 만큼 데이터 특징들도 같이 나열하겠습니다.

Data Characteristics

그래서 이를 처리하는 데에 사용하는 전처리 기법들을 아래의 용어로 부릅니다. 아주 처음에 얘기했던 CIOT 도전과제의 BLURS를 지키기 위함이 있습니다. (Bandwidth, Latency, Uninterrupted, Resource-constraint, Security)

  1. Data cleaning: 하나의 필터링 기법이며 데이터를 가공하거나 결측치를 보간하고 노이즈 값에 대한 스무딩 기법을 의미합니다. 여기에는 1) Declarative data cleaning, 2) Model-based data cleaning이 있습니다.
  2. Data Fusion: aggregation method입니다. 상관성을 보고 직교하는 피쳐를 추출하는 것도 포함되며 말 그대로 붙이고, 예측하는 것도 있습니다.
  3. Edge Mining: 엣지 디바이스를 응용하는 것으로 전송 데이터에 대해 에너지 효율 측면으로 개선하는 기술을 의미합니다.
  4. Data Privay: 데이터 개런티를 보장하는 기술쪽으로 있습니다.
  5. Data Storage and Data Placement: 너무 가까우 붙여도 안됩니다. Edge device의 모바일리티 때문에 Data placement와 Data storage는 제일 적당한 위치에 놓아져야 합니다.

Layers that Focused on Data Management

Device Layer

디바이스 레이어의 모듈들은 모듈 전환(기능 전환), 데이터 수집 모듈 그리고 커맨드 실행 모듈이 있습니다.

Fog Layer

Cloud Layer