김학진
@mildsalmon
·
흔치않고, 진귀하다.

빅데이터를 지탱하는 기술 - 빅데이터 시대의 데이터 분석 기반

제 마음대로 요약하고 정리하는 것이라 빠진 내용들이 많습니다. 시간적 여유가 있으시면, 책을 구매하셔서 읽어보시는 것을 권유드립니다. 1. 빅데이터 시대의 데이터 분석 기반 빅데이터 기술이 기존의 데이터 웨어하우스와 다른 점은 다수의 분산 시스템을 조합하여 확장성이 뛰어난 데이터 처리 구조를 만든다는 점이다. A. [재입문] 빅데이터의 기술 분산 시스템을 활용해서 데이터를 가공해 나가는 …

2021년 10월 31일 · 13 min read

빅데이터를 지탱하는 기술 - 빅데이터의 정착

제 마음대로 요약하고 정리하는 것이라 빠진 내용들이 많습니다. 시간적 여유가 있으시면, 책을 구매하셔서 읽어보시는 것을 권유드립니다. 1. 빅데이터의 정착 "분산 시스템의 발전"과 "클라우드 서비스의 보급"에 따라 대량의 데이터를 효율적으로 처리하는 일이 점차 어렵게 되었다. 이 절에서는 "빅데이터"라는 단어가 퍼질 때까지의 역사를 되돌아본다. A. 분산 시스템에 의한 데이터 처리의 고속화 빅데이터의 …

2021년 10월 24일 · 5 min read

[Book] 빅데이터를 지탱하는 기술

0. 이 책에 대하여 빅데이터를 지탱하는 기술 - 이 책에 대하여 — mildsalmon (blex.me) 1. 빅데이터의 기초 지식 A. [배경] 빅데이터의 정착 빅데이터를 지탱하는 기술 - 빅데이터의 정착 — mildsalmon (blex.me) B. 빅데이터 시대의 데이터 분석 기반 빅데이터를 지탱하는 기술 - 빅데이터 시대의 데이터 분석 기반 — mildsalmon (blex.me)

2021년 10월 24일 · 0 min read

[정보처리기사 필기공부] 빅데이터

1. 맵/리듀스 (Map/Reduce) 대용량 데이터를 신뢰도가 낮은 컴퓨터로 구성된 클러스터 환경에서 병렬 처리를 지원하기 위해서 개발됨 거대한 인풋 데이터를 쪼개어 수 많은 머신들에게 분산시켜서 로직을 수행한 다음 결과를 하나로 합치자는 것이 핵심 아이디어 MR 구글에서 대용량 데이터 처리를 분산 병렬 컴퓨팅에서 처리하기 위한 목적으로 제작한 소프트웨어 프레임워크 함수형 프로그래밍에서 일반적으로 …

2021년 04월 25일 · 1 min read