패스트캠퍼스 BDA 부트캠프 10기 21

[Tableau] 기초용어

측정값(measure)우리의 관심을 받는 대상 그 자체 ex) 키, SNS 언급량, 매출액 차원(dimension)우리가 관심을 가지고 있는 측정값을 어떻게 썰어서 볼 것인가 (Group by) ex) 성별 기준, 광역지자체 분류, 월별 세로선 기준 위가 차원, 아래가 측정값 태블로가 자체적으로 분류하는 것이기에 잘못 분류할 수도 있음. 이럴 때는 해당 값을 드래그 해서 옮기거나 오른쪽 마우스 클릭으로 차원/측정값으로 바꿔주면 됨 연속형"forming an unbroken whole without interruption" 쭉 이어진 것태블로에서 연속형 값은 초록색 알약(pill)으로 표시연속형 값을 화면에 나타낼 경우 화면 한 쪽에 축이 나타남연속형 값을 화면에 나타낼 경우 그라데이션으로 해당 값의 크기..

[5회차] 패스트캠퍼스 BDA 부트캠프 10기 학습일지

1. JOIN을 새롭게 사용하는 법 - USING 사용하기 SELECT * FROM customer C JOIN rental R ON C.customer_id=R.customer_id; SELECT * FROM customer JOIN rental USING (customer_id) JOIN의 기준이 되는 두 테이블의 열의 이름이 같다면 alias를 지정하거나, 동일한 열의 이름을 두 번 쓸 필요 없이 USING 을 사용하여 더 간단하게 JOIN 할 수 있다. 하지만 USING의 실무에서의 사용 빈도가 낮고 쿼리가 복잡해질 경우 잘 안 돌아가는 경우도 있으니 안전하게 JOIN ON을 사용하는 것을 추천한다. 2. 열의 값 합치는 법 - CONCAT 사용하기 SELECT CONCAT(first_name, ..

[4회차] 패스트캠퍼스 BDA 부트캠프 10기 학습일지

[SQL] MySQL, 쿼리, 주석, 데이터, 데이터타입 SQL(Structured Query Language) 데이터베이스와 대화하기 위해 사용하는 약속의 언어(문법) 쿼리 SQL로 쓰인 데이터베이스에 명령을 내리는 문장 주석 1) # 2) -- 3) /* */ 데이터 컴퓨터가 처리할 수 있는 문 heenan.tistory.com [SQL] 데이터 타입, 테이블, 컬럼, 값, 로우, 데이터베이스, 이름 정하기 규칙 숫자형 데이터 기본 특징 데이터간 사칙연산 가능 문자형 데이터 기본 특징 " " 또는 ' '와 반드시 함께 사용 따옴표가 없는 문자는 키워드나 함수, 데이터베이스/테이블/컬럼의 이름으로 인식 데 heenan.tistory.com [SQL] CREATE, SHOW, USE, ALTER, REN..

[SQL] DROP, TRUNCATE, IF EXISTS, INSERT INTO VALUES, DELETE FROM WHERE, UPDATE SET WHERE

데이터베이스 지우기 DROP DATABASE [데이터베이스 이름]; 테이블 지우기 DROP TABLE [테이블 이름]; 테이블 값만 지우기 TRUNCATE TABLE [테이블 이름]; 데이터베이스/테이블이 존재한다면 지우기 DROP DATABASE/TABLE IF EXISTS [데이터베이스/테이블 이름]; 데이터 하나 삽입하기 INSERT INTO [테이블 이름] ([컬럼1 이름], [컬럼2 이름], [컬럼3 이름]) VALUES ([컬럼1 값], [컬럼2 값], [컬럼3 값]); 컬럼 이름 리스트와 컬럼 값 리스트의 갯수는 일치해야 함 데이터 여러 개 삽입하기 INSERT INTO [테이블 이름] ([컬럼1 이름], [컬럼2 이름], [컬럼3 이름]) VALUES ([컬럼1 값], [컬럼2 값], [컬..

[SQL] CREATE, SHOW, USE, ALTER, RENAME, ADD, MODIFY, CHANGE, DROP

데이터베이스 만들기 CREATE DATABASE [데이터베이스 이름]; 데이터베이스 목록 보기 SHOW DATABASES; 데이터베이스 사용하기 USE [데이터베이스 이름]; 테이블 만들기 CREATE TABLE [테이블 이름] ( [컬럼 이름] [데이터 타입], [컬럼 이름] [데이터 타입], ... ); 데이터베이스, 테이블, 컬럼 이름 정하기 규칙 문자, 숫자, _를 사용 이름에 쓰이는 문자는 주로 영문 소문자 사용 한글도 사용은 가능하나 인코딩 이슈로 주로 영문 사용 보통 키워드나 함수명은 대문자, 사용자가 정의한 이름에는 소문자 사용 기능적으로는 대소문자 상관없으나, 가독성을 위해 구분 예약어는 사용 불가 예약어 : 이미 키워드, 함수명 등의 문법적인 용도로 사용되어 이름으로 사용할 수 없는 단..

[SQL] 데이터 타입, 테이블, 컬럼, 값, 로우, 데이터베이스, 이름 정하기 규칙

숫자형 데이터 기본 특징 데이터간 사칙연산 가능 문자형 데이터 기본 특징 " " 또는 ' '와 반드시 함께 사용 따옴표가 없는 문자는 키워드나 함수, 데이터베이스/테이블/컬럼의 이름으로 인식 데이터 타입 변환 ex) - SELECT CAST(123 AS CHAR(5)); - SELECT CONVERT('1004', INT); - SELECT DATE_FORMAT('20211225', %Y-%m-%d') 테이블 데이터베이스에서 데이터를 형태를 정해 모아 놓은 저장 공간 (=행과 열로 이루어진 데이터 표) 컬럼 데이터를 저장하기 위한 틀 1) 컬럼의 이름과 데이터 타입은 테이블을 만들 때 미리 정해짐 2) 컬럼의 이름은 동일한 테이블 내에서 중복될 수 없음 3) 테이블은 반드시 1개 이상의 컬럼을 가져야 함..

[SQL] MySQL, 쿼리, 주석, 데이터, 데이터타입

SQL(Structured Query Language) 데이터베이스와 대화하기 위해 사용하는 약속의 언어(문법) 쿼리 SQL로 쓰인 데이터베이스에 명령을 내리는 문장 주석 1) # 2) -- 3) /* */ 데이터 컴퓨터가 처리할 수 있는 문자, 숫자, 소리, 그림 따위의 형태로 된 정보 MySQL의 데이터 타입 - 정수형 : 소수점이 없는 숫자 데이터 - 실수형 : 소수점이 있는 숫자 데이터 - 문자형 : 텍스트로 구성된 문자열 데이터 +) n은 바이트 의미 - 날짜형 : 날짜와 시간 데이터 => MySQL에서는 데이터를 저장하기 전에 저장 공간의 데이터 타입을 미리 정해야 함 미리 정해둔 데이터 타입이 아닐 경우 데이터 저장 불가 (에러 발생)

[3주차] 패스트캠퍼스 BDA 부트캠프 10기 학습일지

1. 긴 주석 달기 '''~~''' """~~""" 따옴표 3개를 달면 긴 주석 달 수 있음 2. 파이썬 숫자 자료형 정수 실수 복소수 3. 파이썬 연산자 // : 소수점 연산자를 버리기 % : 나눗셈 후 나머지를 표현하기 ** : 거듭제곱을 구하기 int() : 값을 정수로 만들기 divmod(x,y) : 몫과 나머지를 함께 구하기 4. map으로 한꺼번에 형 변환하기 map(int, input("숫자를 입력하세요.").split()) 5. sep으로 값 사이에 문자 넣기 print(1, 2, 3, sep=',') 6. end로 줄 바꾸기 금지하기 print(1, end='') print(2, end='') 7. 값/객체 비교 ==, != : 값 자체를 비교 is, is not : 객체(object)를..

[2주차] 패스트캠퍼스 BDA 부트캠프 10기 학습일지

08.28 월요일 : 친근한 엑셀로 실무 엑셀 데이터 분석 및 기초 수학/통계 시작하기 (이동훈 강사님) [Excel] 함수, COUNT, COUNTA , COUNTBLANK, COUNTIF, COUNTIFS, IF, VLOOKUP, MATCH, SUMIF, SUMIFS, SUMPRODUCT, IFERROR 1. 함수 복잡한 수식이나 계산을 간단한 명령어로 사용할 수 있게 하는 도구 2. COUNT 함수 특정 범위에서 "숫자 데이터"가 들어가 있는 셀의 개수 파악 3. COUNTA 함수 특정 범위에서 데이터가 들어가 heenan.tistory.com [Excel] FIND 함수, SEARCH 함수, LEFT/RIGHT/MID 함수, 텍스트 나누기, 중복 제거하기, FILTER, 데이터 유효성 1. FIN..

[Excel] 대표값, 기초통계량-중심경향성/퍼짐정도, 왜도, 첨도

1. 대표값 자료의 특성을 나타낼 수 있는 대표성을 띠는 수치 2. 기초통계량 1) 중심경향성(Central Tendency) : 데이터 분포의 중심을 보여주는 값, 중심에 얼마나 몰려 있는가? - 최빈값 (Mode) : 가장 빈번하게 나타나는 값, 특히 범주형 자료에서 대표값으로 최빈값을 주로 사용 - 중앙값 (Median) : 자료를 크기 순으로 나여했을 때 가운데 위치하는 값, 순서형 자료의 대표값으로 적합하며 이상치에 크게 영향받지 않음 - 산술 평균 (Arithmetic Mean, Mean) : 자료의 값을 모두 더해서 자료의 수로 나눈 값, 주로 연속형 자료에 사용하며 이상치에 영향을 크게 받을 수 있음 - 가중 평균 (Weighted Mean) : 자료의 중요도에 따라 가중치 부여한 평균 -..