본문 바로가기

전체 글

(72)
[이것이 자바다] Ch11. 기본 API 클래스 11.1. 자바 API 도큐먼트 자바API - 자바에서 기본적으로 제공하는 라이브러리 - 프로그램 개발에 자주 사용되는 클래스 및 인터페이스의 모음 API도큐먼트 - 쉽게 API를 찾아 이용할 수 있도록 문서화한 것 - HTML 페이지로 작성되어 있어 웹 브라우저로 바로 볼 수 있음 Java Platform SE 7 docs.oracle.com 11.2. java.lang과 java.util 패키지 11.2.1 java.lang 패키지 - 자바 프로그램의 기본적인 클래스를 담고 있는 패키지 - 포함된 클래스와 인터페이스는 import 없이 사용 가능 Object : 자바 클래스의 최상위 클래스 System : 표준 입출력 장치, 자바 가상 머신을 종료시킬 때, 쓰레기 수집기를 실행 요청할 때 Class ..
[모각코] 8/20 정형 데이터 마이닝, 분류 분석 1 5절. 정형 데이터 마이닝 1. 데이터 마이닝 개요 데이터 마이닝이란? 모든 사용 가능한 원천 데이터를 기반으로 감춰진 지식, 기대하지 못했던 경향 또는 새로운 규칙 등을 발견하고 이를 실제 비즈니스 의사결정 들에 유용한 정보로 활용하는 일련의 작업! 데이터 마이닝 5단계 목적정의 데이터 마이닝 도입 목적을 명확하게 함 데이터 준비 - 데이터 정제를 통해 데이터의 품질 확보까지 포함 - 필요시 데이터 양 충분하게 확보 데이터 가공 - 목적 변수를 정의하고, 필요한 데이터를 데이터 마이닝 소프트웨어에 적용할 수 있게 가공 및 준비하는 단계 - 충분한 CPU와 메모리, 디스크 공간 등 개발환경 구축이 선행 데이터 마이닝 기법 적용 모델을 목적에 맞게 선택하고 소프트웨어를 사용하는 데 필요한 값 지정 검증 결..
[모각코] 8/17 3절 회귀분석, 4절 시계열 분석 3절. 회귀분석 1. 회귀분석의 개요 가. 회귀분석의 정의 - 하나나 그 이상의 독립변수들이 종속변수에 미치는 영향을 추정할 수 있는 통계기법 - 변수들 사이의 인과관계를 밝히고 모형을 적합하여 관심있는 변수를 예측하거나 추론하기 위한 분석방법 - 독립변수의 개수가 하나이면 단순선형회귀분석, 독립변수의 개수가 두 개 이상이면 다중선형 회귀분석으로 분석할 수 있음 나. 회귀분석의 변수 - 영향을 받는 변수 y: 반응변수, 종속변수, 결과변수 - 영향을 주는 변수 x: 설명변수, 독립변수, 예측변수 다. 선형회귀분석의 가정 1) 선형성 - 입력변수와 출력변수의 관계가 선형 2) 등분산성 - 오차의 분산이 입력변수와 무관하게 일정 - 잔차플롯(점산도)를 활용하여 잔차와 입력변수간에 아무런 관련성이 없게 무작위..
[이것이 자바다] Ch10. 예외 처리 10.1. 예외와 예외 클래스 오류의 종류 1) 에러 - 하드웨어의 오동작 또는 고장으로 인한 실행 중지 - 에러가 발생되면 프로그램은 종료됨 - 정상 실행 상태로 돌아갈 수 없음 2) 예외 - 사용자의 잘못된 조작 혹은 개발자의 잘못된 코딩으로 인해 발생 - 예외가 발생되면 프로그램이 종료됨 - 예외 처리를 추가하면 정상 실행 상태로 돌아갈 수 있음 예외의 종류 1) 일반 예외 - Exception - 예외 처리 코드가 없다면 컴파일 되지 않는 예외 2) 실행 예외 - Runtime Exception - 예외 처리 코드를 생략하더라도 컴파일이 되는 예외 - 경험에 따라 예외 처리 코드를 작성할 필요가 있을 수도 있음 10.2. 실행 예외 10.2.1. NullPointException - 객체 참조가 ..
[모각코] 8/13 기초 통계분석 2절. 기초 통계분석 1. 기술통계 가. 기술통계의 정의 - 자료의 특성을 표, 그림, 통계량 등을 사용하여 쉽게 파악할 수 있도록 정리/요약하는 것 - 자료를 요약하는 기초적 통계를 의미 - 데이터 분석에 앞서 데이터의 대략적인 통계적 수치를 계산해봄으로써 데이터에 대한 대략적인 이해와 앞으로 분석에 대한 통찰력을 얻기에 유리함 예시) 줄기-잎 그림, 도넛차트, 히스토그램, 상자수염그림 나. 통계량에 의한 자료 정리 1) 중심 위치의 측도 가) 자료(데이터) 나) 표본평균 다) 중앙값 2) 산포의 측도 - 대표적인 산포도는 분산, 표준편차, 범위 및 사분위수범위 가) 분산 나) 표준편차 다) 사분위수범위 라) 사분위수 마) 백분위수 바) 변동계수 사) 평균의 표준오차 3) 분포의 형태에 관한 측도 가)..
[모각코] 8/10 통계분석의 이해 1절. 통계분석의 이해 1. 통계 - 특정 집단을 대상으로 수행한 조사나 실험을 통해 나온 결과에 대한 요약된 형태의 표현 - 조사 또는 실험을 통해 데이터를 확보, 조사대상에 따라 총조사와 표본조사로 구분함 2. 통계자료의 획득 방법 가. 총 조사/ 전수조사 나. 표본조사 - 모집단, 원소(모집단을 구성하는 개체), 표본, 모수(모집단에 대한 정보) - 모집단의 정의, 표본의 크기, 조사방법, 조사기간, 표본추출방법을 정확히 명시해야 함 다. 표본 추출 방법 - 표본 추출 방법에 따라 분석결과의 해석은 큰 차이가 발생함 1) 단순랜덤 추출법 : 각 샘플에 번호를 부여, 임의의 n개를 추출하는 방법. 각 샘플은 선택될 확률이 동일함(복원, 비복원 추출) 2) 계통추출법 : 번호를 부여한 샘플을 나열하여 ..
[모각코] 8/6 3과목 3장 실전 문제 풀기 - 오답노트 03. 파생변수는 사용자가 특정 조건을 만족하거나 특정 함수에 의해 값을 만들어 의미를 부여한 변수이다. 다음 중 파생변수의 설명으로 적절한 것은? 파생변수는 매우 주관적인 변수일 수 있으므로 논리적 타당성을 갖춰야 한다. 파생변수는 많은 모델에서 공통적으로 많이 사용될 수 있다. 파생변수는 재활용성이 높다. 파생변수는 다양한 모델을 개발해야 하는 경우, 효율적으로 사용할 수 있다. : 1번, 파생변수는 사용자가 특정 조건을 만족하거나 특정 함수에 의해 값을 만들어 의미를 부여한 변수로 매우 주관적일 수 있으므로 논리적 타당성을 갖추어 개발해야 한다. 10. 다음 중 결측치에 대한 설명으로 가장 부적절한 것은? 해당 칸이 비어있는 경우 결측치 여부는 알기 쉽다. 관측치가 있지만 실상은 디폴트값이 기록된 ..
[모각코] 8/3 Day 12~14 (3과목) 4절. 데이터 구조와 데이터 프레임 - 1 1. 벡터 → 벡터는 동질적이다 : 한 벡터의 모든 원소는 같은 자료형 또는 같은 모드를 가짐 → 벡터는 위치로 인덱스 된다 → 벡터는 인덱스를 통해 여러 개의 원소로 구성된 하위 벡터를 반환할 수 있다 : V[c(2, 3)]은 v벡터의 2번쨰, 3번째 원소로 구성된 하위벡터 → 벡터 원소들은 이름을 가질 수 있다 2. 리스트 → 리스트는 이질적이다 : 여러 자료형의 원소들이 포함될 수 있음 → 리스트는 위치로 인덱스 된다 → 리스트에서 하위 리스트를 추출할 수 있다 → 리스트의 원소들은 이름을 가질 수 있다 3. R에서의 자료 형태 객체 예시 모드 숫자 3.14 수치형 숫자 벡터 c(1, 2, 3, 4) 수치형 문자열 "Tom" 문자형 문자열 벡터 c("Tom..