용어 | 아파치 하둡 | 참고 | - |
---|---|---|---|
영어/불어 | Apache Hadoop / | ||
저작권기술 용어 아파치 하둡 Apache Hadoop
아파치(Apache)가 개발한 오픈소스 기반의 분산처리 기술로서 정형 빅데이터 및 비정형 빅데이터 분석에 사용된다. 하둡은 x86 서버로 가상화된 대형 스토리지(HDFS)를 구성하고, HDFS에 저장된 거대한 데이터셋을 간편하게 분산처리 할 수 있는 자바(Java) 기반의 맵리듀스(MapReduce) 프레임워크를 제공한다. 하둡 공통 패키지에는 하둡 파일 시스템(HDFS), OS 수준 앱스트랙션(OS level abstractions), 맵리듀스(MapReduce) 엔진이 포함된다. 하둡 분산파일 시스템(HDFS: Hadoop Distributed File System)은 구글 파일 시스템을 대체한 것이며 맵리듀스(MapReduce)는 구글에서 대용량 데이터를 분산 병렬 컴퓨팅에서 처리하기 위해서 제작하여 2004년 발표한 소프트웨어 프레임워크다. ※ 참고. 맵리듀스 |