08.28 월요일 : 친근한 엑셀로 실무 엑셀 데이터 분석 및 기초 수학/통계 시작하기 (이동훈 강사님)
[Excel] 함수, COUNT, COUNTA , COUNTBLANK, COUNTIF, COUNTIFS, IF, VLOOKUP, MATCH, SUMIF, SUMIFS, SUMPRODUCT, IFERROR
1. 함수 복잡한 수식이나 계산을 간단한 명령어로 사용할 수 있게 하는 도구 2. COUNT 함수 특정 범위에서 "숫자 데이터"가 들어가 있는 셀의 개수 파악 3. COUNTA 함수 특정 범위에서 데이터가 들어가
heenan.tistory.com
[Excel] FIND 함수, SEARCH 함수, LEFT/RIGHT/MID 함수, 텍스트 나누기, 중복 제거하기, FILTER, 데이터 유효성
1. FIND 함수 긴 텍스트에서 특정 단어나 문장이 시작하는 위치를 숫자로 출력 띄어쓰기까지 포함해서 문자를 세며, 대소문자를 구분(a!=A) =FIND("찾을 텍스트", 긴 텍스트, 문자열을 찾기 시작할 위
heenan.tistory.com
[Excel] 통계학-기술통계학/추론통계학, 가설 검정(귀무가설, 대립가설), p-value, t-test, F-검정, 회귀
1. 통계학 산술적 방법을 기초로 하여, 주로 다량의 데이터를 관찰하고 정리 및 분석하는 방법을 연구하는 수학의 한 분야 연구 목적에 필요한 자료 및 정보를 최적한 방법으로 수집하고, 수집한
heenan.tistory.com
08.29 화요일 : 깊이 있는 데이터 분석을 위한 기초 수학/통계
[Excel] 통계학, 데이터 분석의 단계, EDA
1. 통계학이란? 산술적 방법을 기초로 하여, 다량의 데이터를 관찰하고 정리 및 분석하는 방법을 연구하는 수학의 한 분야 불확실성 속에서 정보를 찾아내는 학문 부분으로 전체를 추론하는 학
heenan.tistory.com
[Excel] 데이터 탐색 사례, 기술/추론 통계, 데이터 탐색 과정의 목적, 산점도 그리기(상관분석), Box
1. 대표값으로 데이터 탐색 사례 기술 통계법 - 평균, 분산, 표준편차, 왜도, 첨도 등의 통계량 확인 대표값을 바탕으로 시각화할 경우 경향성(군집의 특성)을 눈으로 확인해서 인사이트를 얻을
heenan.tistory.com
[Excel] 변량, 계급, 도수, 상대 도수, 도수분포표, 히스토그램, 평균, 분산, 표준편차, 정규분포, 표
1. 변량 자료의 수치, 즉 데이터의 값을 의미하는 용어 (숫자, 문자 모두 가능) 2. 계급 변량을 일정한 간격으로 나눈 구간 계급을 정할 때 변량의 최소, 최대를 고려 3. 도수 각 계급에 속하는 변량
heenan.tistory.com
[Excel] 확률 변수, 확률 분포, 자료의 종류(범주형/양적/명목형/순서형/이산형/연속형), 확률분포
1. 통계의 목적 아직 벌어지지 않은 일을 예측하기 위해서 미래에 대한 예측 -> 일어나지 않은 사건에 대한 가능성을 함수로 나타내기 2. 확률 변수 일정한 확률을 갖고 일어나는 사건에 수치가
heenan.tistory.com
08.30 수요일 : 깊이 있는 데이터 분석을 위한 기초 수학/통계
[Excel] 대표값, 기초통계량-중심경향성/퍼짐정도, 왜도, 첨도
1. 대표값 자료의 특성을 나타낼 수 있는 대표성을 띠는 수치 2. 기초통계량 1) 중심경향성(Central Tendency) : 데이터 분포의 중심을 보여주는 값, 중심에 얼마나 몰려 있는가? - 최빈값 (Mode) : 가장 빈
heenan.tistory.com
08.31 목요일 : 친근한 엑셀로 실무 엑셀 데이터 분석 및 기초 수학/통계 시작하기 (이동훈 강사님)
1. 머신러닝
- 경험과 학습을 통해 자동으로 개선하는 컴퓨터 알고리즘의 연구이며 인공지능의 한 분야
- 컴퓨터가 어떤 작업(T, task)을 하는데 있어서 경험(E, experience)으로부터 학습하여 성능(P, performance)을 향상시키는 학문
1) 지도 학습(Supervised Learning)
- 정답(Y, 종속변수)이 있는 데이터를 활용해 데이터를 학습하고, 학습한 모델이 얼마나 정답을 정확하게 맞추는지 평가하는 학습
- 가장 많이 사용.,과적합 주의해야 함
- 분류(Classification) 문제 해결 가능
- 주어진 입력 값을 2개 혹은 여러 개의 결과값(구간)으로 분류하는 지도 학습
- 회귀 문제보다 압도적으로 정확도가 높음 (구간만 맞추면 되므로)
- ex. 스팸 메일 여부 판단, 대출 상환 여부 판단. 구매 고객군 분류
- 회귀(Regression) 문제 해결 가능
- 연속형 수치의 입력 값을 활용해 특정 수치(한 지점)를 예측하는 지도 학습
- ex. 다음 해 매출액 예측, 기온 예측, 주가 예측
2) 비지도 학습(Unsupervised Learning)
- 정답(Y)이 없는 데이터를 활용해 데이터를 학습
- 데이터가 어떻게 구성되어 있는지, 혹은 어떻게 분류될 수 있는지에 대한 문제 해결
- 군집화-비슷한 특성 가진 것들끼리 모음
3) 강화 학습(Reinforcement Learning)
- 에이전트(학습 시스템)가 취한 행동에 대해 보상 또는 벌점을 주어 가장 큰 보상을 받는 방향으로 유도하는 방법
- 가장 큰 보상을 얻기 위해 에이전트가 해야 할 행동을 선택하는 방법을 정의하게 되는데 이를 '정책'이라고 함
- 로봇공학에서 많이 사용. 인간의 학습 방식과 유사
[Excel] 시계열 데이터, 지수 평활법, FORECAST.ETS
1. 시계열 데이터 시간의 흐름에 따라 정리한 데이터 (ex. 주가, 기온) 정상성 : 추세나 계절성을 가지고 있지 않으며, 관측된 시간에 무관한 성질 +) 추세 : 장기적으로 증가하거나, 감소하는 경향
heenan.tistory.com
[Excel] 데이터 시각화, 차트 디자인, 콤보형 차트, 거품형 차트, 폭포형 차트, 조건부 서식, 대쉬보
1. 데이터 시각화 데이터 분석 결과를 쉽게 이해할 수 있도록 시각적으로 표현하고 전달되는 과정 raw 데이터는 이해하고 사용하기 어렵다는 점을 보완 의사 결정자가 데이터 간의 관계를 식별하
heenan.tistory.com
09.01 금요일 : 데이터 분석을 위한 핵심 Tool Python (김상모 강사님)
- 진법 : 진법이란 0부터 n개의 숫자를 사용해서 수를 표현하는 방법
- 2진법 : 0과 1 두 개의 숫자를 사용해서 수를 표현하는 것
- 10진법 : 0~9까지의 10개의 수를 사용해서 표현하는 것
- 16진법 : 0~9 10개의 수와 A~F까지의 6개의 문자로 표현하는 것
- 컴퓨터 프로그램 : 컴퓨터가 수행할 명령어를 적어놓은 문서 (작업지시서)
- 프로그램 : 어떤 문제를 해결하기 위해 컴퓨터가 실행해야 하는 명령어의 집합체 (명령어의 시퀀스)
- 프로그램을 짜는 목적 : '남', 즉 사용자를 위해 작성
- 프로그래밍 : 컴퓨터 프로그램을 만들 때 필요한 모든 행위를 포함하는 개념
- 코딩 : 소스 코드를 작성하는 행위
- 소스 코드 : 프로그래밍 언어로 작성된 텍스트 파일
- C언어는 컴파일러라 한꺼번에 실행
- 파이썬은 인터프리터라 한 줄씩 실행
- 데이터 분석가에게 파이썬이란?
- 파이썬이 데이터 분석가에게 필수는 아니지만 매우 유용
- 파이썬은 다양한 데이터 분석 라이브러리와 패키지를 제공
- 웹 크롤링, 데이터 시각화, 머신러닝, 딥러닝 등의 분야에 파이썬을 적용할 수 있음
- 파이썬 활용은 데이터 분석가의 역량과 효율성을 향상시킴
- 파이썬은 데이터 분석에 가장 인기 있는 언어 중 하나
- 실무 데이터 분석가들 중 많은 사람들이 파이썬을 데이터 분석의 필수 툴로 꼽고 있음
'패스트캠퍼스 BDA 부트캠프 10기 > 학습일지' 카테고리의 다른 글
[5회차] 패스트캠퍼스 BDA 부트캠프 10기 학습일지 (0) | 2023.10.13 |
---|---|
[4회차] 패스트캠퍼스 BDA 부트캠프 10기 학습일지 (0) | 2023.10.06 |
[3주차] 패스트캠퍼스 BDA 부트캠프 10기 학습일지 (0) | 2023.09.08 |
[1주차] 패스트캠퍼스 BDA 부트캠프 10기 학습일지 (1) | 2023.08.25 |