전체 글
코딩 어린이 백과사전
-
정의 : 수집한 데이터를 다양한 각도에서 관찰하고 이해하려 노력하는 과정. 데어터를 분석하기 위해 그래프나 통계적인 방법을 활용하여 직관적으로 보는 과정이다. 과정 데이터를 전체적으로 살펴보기 : 문제가 있는지 확인 tail과 head 부분을 확인 (이상치, 결측치를 확인하는 과정) 데이터의 개별 속성값을 관찰 (각 속성값이 예측한 범위와 분포를 갖는지 확인하는 과정, 그렇지 않다면 원인/문제 파악) 속성간의 관계에 초점을 맞추고 관찰에서 찾아내지 못했던 패턴을 발견 (상관관계나 시각화 같은 것) EDA 아래의 두가지 질문을 확인하기 위한 것 변수에 내재된 변동성(variation) 유형은 어떻게 되는가? 변수들 간에 공변동(covariation)은 어떻게 되는 것인가? categorical variab..
탐색적 데이터 분석 (EDA)란정의 : 수집한 데이터를 다양한 각도에서 관찰하고 이해하려 노력하는 과정. 데어터를 분석하기 위해 그래프나 통계적인 방법을 활용하여 직관적으로 보는 과정이다. 과정 데이터를 전체적으로 살펴보기 : 문제가 있는지 확인 tail과 head 부분을 확인 (이상치, 결측치를 확인하는 과정) 데이터의 개별 속성값을 관찰 (각 속성값이 예측한 범위와 분포를 갖는지 확인하는 과정, 그렇지 않다면 원인/문제 파악) 속성간의 관계에 초점을 맞추고 관찰에서 찾아내지 못했던 패턴을 발견 (상관관계나 시각화 같은 것) EDA 아래의 두가지 질문을 확인하기 위한 것 변수에 내재된 변동성(variation) 유형은 어떻게 되는가? 변수들 간에 공변동(covariation)은 어떻게 되는 것인가? categorical variab..
2021.09.27 -
리스트란? 파이썬에서 가장 자유도가 높은 선형자료 입니다. 순서를 가진 항목들의 모임이라고 할 수 있다. ex) L = [item0, item1, item2, ... , item(n-1)] 항목들이 순서대로 나열되어 있고, 위치*를 갖는다는게 핵심이다. 파이썬 리스트에서 활용할 수 있는 추상 자료형 list() 비어있는 새로운 리스트 생성 insert(pos, e) pos위치에 e를 삽입한다. delete(pos) pos위치에 있는 요소를 꺼내고 반환 isEmpty() 리스트가 비어있는지 검사한다. getEntry() pos 위치에 있는 요소를 반환한다. size() 리스트안의 요소의 개수를 반환 clear() 리스트를 초기화 한다. find(item) 리스트에서 item이 있는지 찾아 위치를 반환한다...
[파이썬] 눈으로 확인하며 배우는 리스트 부수기리스트란? 파이썬에서 가장 자유도가 높은 선형자료 입니다. 순서를 가진 항목들의 모임이라고 할 수 있다. ex) L = [item0, item1, item2, ... , item(n-1)] 항목들이 순서대로 나열되어 있고, 위치*를 갖는다는게 핵심이다. 파이썬 리스트에서 활용할 수 있는 추상 자료형 list() 비어있는 새로운 리스트 생성 insert(pos, e) pos위치에 e를 삽입한다. delete(pos) pos위치에 있는 요소를 꺼내고 반환 isEmpty() 리스트가 비어있는지 검사한다. getEntry() pos 위치에 있는 요소를 반환한다. size() 리스트안의 요소의 개수를 반환 clear() 리스트를 초기화 한다. find(item) 리스트에서 item이 있는지 찾아 위치를 반환한다...
2021.09.23 -
내장 범위 언어의 일부로 정의된 변수와 리터럴들 프로그램의 어디에서나 사용할 수 있다. 전역 범위(global scope) 소스 파일의 맨 꼭대기 레벨 함수나 클래스 밖에서 생성한다. 프로그램의 어디에서나 사용할 수 있다. 지역 범위(local scope) 함수나 클래스의 멤버함수(메소드) 안에서 생성 그 안에서만 사용할 수 있고, 함수의 매개변수들도 지역 범위 인스턴스 범위(instance scope) 클래스의 데이터 멤버로 생성된 변수이고, 멤버 변수라고 부르기도 한다. 클래스 내의 다른 함수들에서 사용될 수 있다. 전역변수 def calc_perimeter(radius) : #global perimeter print("파이값:", ㅔㅑ perimeter = 2*pi*radius 전역변수 pi, pe..
[파이썬]변수의 범위내장 범위 언어의 일부로 정의된 변수와 리터럴들 프로그램의 어디에서나 사용할 수 있다. 전역 범위(global scope) 소스 파일의 맨 꼭대기 레벨 함수나 클래스 밖에서 생성한다. 프로그램의 어디에서나 사용할 수 있다. 지역 범위(local scope) 함수나 클래스의 멤버함수(메소드) 안에서 생성 그 안에서만 사용할 수 있고, 함수의 매개변수들도 지역 범위 인스턴스 범위(instance scope) 클래스의 데이터 멤버로 생성된 변수이고, 멤버 변수라고 부르기도 한다. 클래스 내의 다른 함수들에서 사용될 수 있다. 전역변수 def calc_perimeter(radius) : #global perimeter print("파이값:", ㅔㅑ perimeter = 2*pi*radius 전역변수 pi, pe..
2021.09.23 -
결정계수! 너 대체 정체가 뭐야! 머신러닝을 처음 공부하기 시작하면 막히는 부분이 있다. 바로 결정계수이다. 확률을 심도 있게 배우지 않은 학생들은 모두 결정계수에서 좌절한 후, 머신러닝은 역시 공대생의 것이라며 프로그래밍을 포기하곤 한다. 그래서 오늘, 결정계수를 최대한 쉽게 설명하는 글을 적어보려 한다. 결정계수 = R제곱 통계량 = Coefficient of Determination = R^2 = R squred 이름도 많다... 한 줄로 설명하자면, 결정계 수란 = '회귀 모델의 성과 지표' 1에 가까울 수록 좋은 회귀 모델 0에 가까울 수록 나쁜 모델 음수가 나올경우, 바로 폐기해야 하는 모델 결정계수를 구하는 공식은 아래와 같다. 여기서 주의깊게 봐야 할 부분은 바로 이 부분이다. 결정계수의 ..
[쉬운 설명]머신러닝 결정계수(R^2) 뜻, 증명결정계수! 너 대체 정체가 뭐야! 머신러닝을 처음 공부하기 시작하면 막히는 부분이 있다. 바로 결정계수이다. 확률을 심도 있게 배우지 않은 학생들은 모두 결정계수에서 좌절한 후, 머신러닝은 역시 공대생의 것이라며 프로그래밍을 포기하곤 한다. 그래서 오늘, 결정계수를 최대한 쉽게 설명하는 글을 적어보려 한다. 결정계수 = R제곱 통계량 = Coefficient of Determination = R^2 = R squred 이름도 많다... 한 줄로 설명하자면, 결정계 수란 = '회귀 모델의 성과 지표' 1에 가까울 수록 좋은 회귀 모델 0에 가까울 수록 나쁜 모델 음수가 나올경우, 바로 폐기해야 하는 모델 결정계수를 구하는 공식은 아래와 같다. 여기서 주의깊게 봐야 할 부분은 바로 이 부분이다. 결정계수의 ..
2021.09.18 -
1. 최근접 이웃 알고리즘이 필요한 이유 일단 선형 회귀 분석이 왜 필요한지 이해해야 한다. 머신 러닝을 공부하는 사람이라면 K-최근접 알고리즘을 사용하여 테스트 데이터의 타깃 값을 알아내는 걸 첫 번째로 공부했을 것이다. 하지만, k최근접 알고리즘의 한계는 바로, 트레인 데이터 범위 밖의 테스트 데이터의 값의 타깃 값을 알아낼 수 없다는 것이다. 예를 들자면, 개미의 길이 별 무게 데이터를 가지고, 새로운 개미의 무게를 측정하는 프로젝트가 있다고 하자. 우리가 가지고 있는 교육 데이터는 다음과 같다. 길이 무게 1cm 1g 2cm 2g 3cm 3g 만약 k최근접 알고리즘을 사용하여 주변의 3개의 데이터 값을 참고하여 길이 4cm인 개미의 무게를 측정한다고 해보자. k최근접 알고리즘의 예측값은 가장 근접..
[간단 설명]k-최근접 이웃 알고리즘, 선형 회귀 분석, 다항 회귀 분석이 전부 왜 필요할까?1. 최근접 이웃 알고리즘이 필요한 이유 일단 선형 회귀 분석이 왜 필요한지 이해해야 한다. 머신 러닝을 공부하는 사람이라면 K-최근접 알고리즘을 사용하여 테스트 데이터의 타깃 값을 알아내는 걸 첫 번째로 공부했을 것이다. 하지만, k최근접 알고리즘의 한계는 바로, 트레인 데이터 범위 밖의 테스트 데이터의 값의 타깃 값을 알아낼 수 없다는 것이다. 예를 들자면, 개미의 길이 별 무게 데이터를 가지고, 새로운 개미의 무게를 측정하는 프로젝트가 있다고 하자. 우리가 가지고 있는 교육 데이터는 다음과 같다. 길이 무게 1cm 1g 2cm 2g 3cm 3g 만약 k최근접 알고리즘을 사용하여 주변의 3개의 데이터 값을 참고하여 길이 4cm인 개미의 무게를 측정한다고 해보자. k최근접 알고리즘의 예측값은 가장 근접..
2021.09.18 -
우리가 학창 시절 배운 것처럼 함수는 임의의 값 x를 넣으면 y를 꺼내 주는 친구지. 근데 프로그래밍 언어를 배우다 보면, 함수와 비슷한 역할을 하는 것 같은데, 메서드(method)라고 분류해서 부르는 친구들이 있어. 그렇다면 대체 함수(function)와 메서드(method)의 차이점이 뭘까? 함수와 메서드는 둘다 특정 값을 입력받아 자신들만의 과정을 거쳐 y값을 출력하는 장치야. 하지만 함수는 어디에나 쓰일 수 있는 '프리랜서'같은 역할이고, 메서드란 '클래스에 포함되어 있거나, 객체와 함께 일하는' 직장인 같은 느낌이지. 예를 들자면, 함수 print('adam')는 아무 곳에서나 쓰일 수 있지만, 특정 객체 adam이 존재한다고 할 때, 메서드는 adam.print() 같이 쓰이는 거지. 그리고..
쉽게 풀어 쓴 함수와 메서드의 차이점, 눈으로 보는 패키지 구조우리가 학창 시절 배운 것처럼 함수는 임의의 값 x를 넣으면 y를 꺼내 주는 친구지. 근데 프로그래밍 언어를 배우다 보면, 함수와 비슷한 역할을 하는 것 같은데, 메서드(method)라고 분류해서 부르는 친구들이 있어. 그렇다면 대체 함수(function)와 메서드(method)의 차이점이 뭘까? 함수와 메서드는 둘다 특정 값을 입력받아 자신들만의 과정을 거쳐 y값을 출력하는 장치야. 하지만 함수는 어디에나 쓰일 수 있는 '프리랜서'같은 역할이고, 메서드란 '클래스에 포함되어 있거나, 객체와 함께 일하는' 직장인 같은 느낌이지. 예를 들자면, 함수 print('adam')는 아무 곳에서나 쓰일 수 있지만, 특정 객체 adam이 존재한다고 할 때, 메서드는 adam.print() 같이 쓰이는 거지. 그리고..
2021.09.18