안녕하세요.

본 포스팅은 빅데이터 강의를 위해서 진행합니다. 
시중에는 많은 강의가 있습니다. 개발자를 위한 빅데이터 강의, 빅데이터 MBA 등등 차고도 넘친다고 생각합니다.
하지만 저처럼 아무런 개발자 경력없이 빅데이터에 관심을 가졌던 사람들을 위한 강의는 좀처럼 보기 힘들고 ,
또한 본다고 해도 어렵습니다. 그래서 강의를 만들어 보려고 합니다.

저는 공대를 나와서 경영 일반에 속하는 구매 업무를 7년하고, 
빅데이터를 심화공부하고 싶어서 영국에서 Msc. Machine Learning을 전공하고 돌아왔습니다.

얼핏보면 이미 공대의 백그라운드에서 대학교때 배운 가닥으로 배워서 가능하다고 생각하실수도 있는데,
대학을 졸업하고 8년이면 대학 때 공부하던 기억은 남지 않습니다. 
다만 공대생의 습관, 즉 궁금해하고, 쓸데없이 이것저것 해보고, 
그리고 포기하고, 다시 이것저것 해보고, 그리고 다시 포기하고, 그러다가 얻어걸려서 이해하게 되는 습관은 가지고 있습니다. 

저는 회사에서 엑셀을 잘 다루는 편에 속하였습니다.
그래서 전 회사에서 엑셀에 대한 질문을 많이 받았습니다.
회사에서 같은 공대를 나오고 구매를 하시는 분들을 만나면서 크게 두 분류로 나눌수 있었습니다. 
무엇을 궁금해 하시어 조금만 알려줘도 이해하거나 이해를 못해도 스스로 깨닫기 위해 노력하시는 분들,
아니면 그것은 내가 잘못하기 때문에 그일은 절대 내가할수 없고, 
내가하는 것보다 남을 시켜야 효율이 난다고 생각하고 엑셀업무를 피하시는 분들


공대생은 졸업해서 개발을 하게되면 개발만 하시는 경우가 많습니다. 
개발만 하시는 분들도 문과생들처럼 사람들을 위해 이해시키는 보고서도 작성을 하고,
사람들을 만나서 관계를 맺고 이야기를 하고, 발표도 하게 됩니다. 
상대적으로 문과출신이라고 하시는 분들이 이런 보고서 작성과 , 발표에 능하다고 생각합니다.
하지만 회사생활 7년 8년차에 접하게 되면 그 배경이라는게 
나를 표현하는 하나의 무늬가 될뿐이지, 나의 선천적 능력이 될수는 없습니다. 
즉 처음에는 잘 못하지만, 공대생들도 발표연습을 하게 되면 발표도 잘할수 있고, 
기술 영업업무를 하시면 영업업무도 잘하시게 되고, 글짓기를 좋아하면 글을 잘쓰게 됩니다.

하지만 문과를 나오신 분들 중에 혹은 공대를 나왔지만, 
'나는 컴맹이지만 인터넷은 하는데 엑셀이나 이런 것은 잘 못하겠다. ' 라며
그건 내가 잘 할수 없는 장애인에 빗대어 본인을 설명하고 포기하는 경우를 많이 봤습니다.
그분들이 컴퓨터에 대해 두려움을 가지고 학습의 속도가 느린 것은 이해하나, 
포기를 하고 본인의 업무를 남에게 미루는 것은 이해할수 없습니다.

그러한 포기가 본인만의 선택이고 그선택을 존중하지만,
그 선택으로 인해서 본인은 그업무를 맡아야 함에도 불구하고 
남에게 미루어 본인의 역할을 못한다면 그때부터는 민폐가 됩니다 
그런 분들은 애초에 세상을 살고 사회생활을 하면서 
엑셀 혹은 컴퓨터로 복잡한 수치를 해석하고 데이터를 분석하는 일을 피해 다니며,
주변사람들과 업무분장에서 그러한 업무를 맡지 않고 잘 지내시기를 기원합니다. 
하지만 세상이 점점 처리해야하는 데이터도 많아지고, 
누구는 데이터를 분석해서 보고서를 쓰고 그러한 보고서들이 점점 대우를 받는 세상에서
스스로만 컴맹이라는 단어에 갇혀서 아무런 노력도 하지 않고, 
남에게 본인의 업무를 미루거나 강압하는 위치에 간다면 향후에는 도태될 것이라 생각됩니다.

요즘은 초등학교때 코딩을 배우고자 하는 아이들도 많고 , 가르치는 학교 학원도 많아졌습니다.
제가 초등학교때는 베이직이라는 코딩을 배웠습니다. 하지만 그때 배운 내용은 현시대에서는 더이상 쓰이지 않습니다.
그럼에도 불구하고 그때 배운 베이직이 저에게 소중한 경험인 이유는 그때 배운것은 베이직 프로그래밍이 아니라,
포기하지않고 스스로 문제를 인식하고, 해결해나가는 자세를 배웠습니다
아무도 가르쳐주지 않지만, 책을 보며 끙끙대며 비효율적이다 싶지만 
똑같은 시행착오를 10번씩 겪으면서, 다른 방법을 해야한다는 필요성을 느끼며
다른 방법으로 길을 찾아 문제를 해결하는 경험과 그 습관을 배웠습니다.

요즘 빅데이터를 공부해야 하시겠다고 하신분들은 굉장히 많고 국민적 관심을 가지고 있다고 생각합니다.
빅데이터를 공부해본 사람으로서 그분들에게 말씀드리고 싶은것은 쉽지 않다는 말씀을 드리고자 합니다.

기본적으로 빅데이터 분석에는 확률 및 통계학에 내용이 들어갑니다.
통계학이 필요한 이유는 데이터가 많아져도 그 데이터가 전체를 대표하지 못하기 때문에 
통계적 시각으로 그 데이터가 전체를 대표하는 의미를 뽑아낼수 있는지를
증명하거나 생각할때 필요하고, 혹은 어떤 일이 발생할 가능성, 
즉 확률을 계산해서 확률이 가장 높은 것을 제안하는 분석할 때 확률에 대한 지식이 필요합니다.

또한 그러한 발췌한 데이터를 행렬로 인식하고 그 행렬을 연산하는 프로그램을 짜기 때문에 
행렬에 대한 지식인 선형대수학도 필요합니다.

 컴퓨터로 진행하는 것이라서 프로그래밍이 포함됩니다.
물론 개발자가 될 정도의 프로그래밍을 할필요는 없고 기초 코딩은 하고,코드를 보고 읽을 정도는 되어야 합니다.

또한 분석하는 데이터에 대한 기본지식은 가지고 있어야 목표하고자하는 데이터가공 및 분석이 가능합니다.
즉 유전자 데이터를 이용한 유전자별 그룹을 나눌 경우에는 최소한  DNA염기서열에 대한 지식이 있어야 하며,
경제 지표를 긁어와서 경제 성장과 비슷한 패턴의 경제 지표를 찾으려고할때는 경제학이 필요합니다.

이렇듯 여러가지 지식이 필요하지만 어렵다고 벌써부터 겁을 먹고 포기할필요는 없습니다.
왜냐하면, 전문적인 수준까지 가기전에는 항상 기초적인 수준이 존재하니까요.
위의 지식들은 빅데이터 알고리즘을 만들기 위한 분들이라면 높은수준의 학습이 필요합니다.
하지만  여러분들은 모든 알고리즘을 새로 만드실 분들은 아닙니다.
 그저 만들어진 알고리즘을 각자의 분야에서 활용하고 거기에서 가치를 창출해나가시면 됩니다.

즉 집에 전구를 달고자 하시면 전구를 만드실 필요가 없고
전구의 특성과 주의할 점 그리고 어떻게 해야 불이 켜지는 정도만 알면되지,
전구의  구동원리, 전구의 재질, 전구의 효율을 높이게 위해서 개선된 회로를 만드실 필요가 없다는 것입니다.

따라서 강의는 빅데이터 분석에서 중요한 알고리즘을 선별해서 기초부터 심화까지 진행하고자 합니다.
그리고 그 분석을 하기 위한 툴은 R, 그리고 파이썬 프로그래밍, 마지막으로 SQL이 중심이 됩니다.
 
제가 올리는 포스트를 보게되도 모든 것을 이해할수는 없을 것입니다.
하지만 기초적인 흥미와 더 나은 next level를 위해서 디딤게 되는 디딤돌과 같은 역할은 할수 있도록하고자 합니다. 

그럼 많은 관심과 사랑부탁드립니다
감사합니다.


+ Recent posts