[Hadoop] Hadoop 개념 잡기
Hadoop 1. Hadoop은 Apache의 오픈소스 프로젝트이며, Java로 개발된 프레임워크이다. 여러 개의 commodity hardware(상용 컴퓨터)를 사용하여 대용량 비정형 데이터를 분산 저장 및 처리할 수 있다. > 필요성? >> 인터넷 보급률 증대에 따라, 빅데이터 시대를 맞이함 >> 빅데이터를 처리하기 위해 저장소가 마땅치 않음 (scale up에도 한계가 있기 때문에 scale out이 필요함) >> 여러 저장소에 분산하여 관리할 필요가 있음 2. Hadoop Eco-System : Hodoop은 분산 프로그래밍 프레임워크이며, Hadoop Eco-System은 Hadoop을 이루고 있는 다양한 서브 프로젝트의 모임이다. - 스트리밍 데이터 : 대량 데이터의 흐름 속에서 즉각적인 데..
2019. 12. 2. 11:15