Immersion In Data

분류 전체보기 199

[AI] Decision Tree

1. Decision Tree 의사결정나무(Decision Tree)는 설명변수(X) 간의 관계나 척도에 따라 목표변수(Y)를 예측하거나 분류하는 문제에 활용되는 나무 구조의 모델이다. 설명변수의 관측값을 모델에 입력해 목표변수를 분류하거나 예측하는 지도학습 기반의 방법론이다. 의사결정나무 모델을 사용하는 주된 이유는 목표변수(Y)를 예측하거나 분류 문제를 해결함에 있어서 어떤 설명변수가 가장 중요한 영향인자인지 확인할 수 있고, 각 설명변수별로 어떤 척도에 따라 예측 또는 분류했는지 상세한 기준을 알 수 있다. - Decision Tree의 장점 1. 결과 해석에 용이 : 직관적인 해석 가능, 주요 변수와 분리기준 제시 2. 비모수적 모델 : 통계모델에 요구되는 가정에 자유로움 3. 변수 간 상호작용 ..

AI 2022.08.18

[AI] K-NN(K-Nearest Neighbor)

1. K-NN K-최근접 이웃(K-Nearest Neighbor) 알고리즘은 분류 알고리즘입니다. 비슷한 특성을 가진 데이터는 비슷한 범주에 속하는 경향이 있다는 가정하에 사용한다. 위의 그림을 봤을 때, 세모 모양의 데이터는 주변에 노란색 그룹의 데이터들이 많이 때문에 노란색 그룹에 속한다고 추측할 수 있다. 이처럼 주변의 가장 가까운 K개의 데이터를 보고 데이터가 속할 그룹을 판단하는 알고리즘이 K-NN 알고리즘이다. K-NN 알고리즘은 거리를 측정할 때, 유클리드 거리(Euclidean distance)를 사용한다. K-NN알고리즘의 특징은 K의 값에 따라 분류가 달라질 수 있다는 점이다. 위의 그림을 보면, K의 값이 1일 때는 초록색 그룹에 속한다고 볼 수 있고, K의 값이 3일 때는 노란색 그..

AI 2022.08.18

[AI] Logistic Regression

1. Logistic Regression 회귀 분석 방식의 핵심 기능 중 하나인 로지스틱 회귀는 선형 분석(Linear Regression)과 가장 큰 차이점이 있는데, 값이 아닌 확률로서 분류한다는 점이다. 기존의 선형 회귀 분석에서는 단순히 입력한 값을 그대로 독립변수로 받아서 사용하다 보니 평균보다 차이가 큰 값이 입력되면 값이 크게 달라져 버리는 문제점이 있다. 이를 개선하기 위해 로지스틱 회귀에서는 시그모이드 계산을 사용한다. 입력값을 비율로 변환하여 항상 0과 1사이의 값으로 한정시켜 범위를 벗어나는 경우를 예방하고 정확도가 떨어지는 것을 방지한다. 2. Sigmoid 입력 값을 비율로 변환하는 것이 시그모이드의 가장 큰 기능이다. 입력 값이 어느 숫자든 상관없이 결과 값이 항상 0과 1사이에..

AI 2022.08.17

[AI] RBM(Restricted Boltzmann Machine)

1. RBM RBM은 제한된 볼츠만 머신이며, 말 그대로 볼츠만 머신에서 층간 연결을 없앤 형태의 모델이다. 차원 감소, 분류, 선형 회귀 분석, 협업 필터링(collaborative filtering), 특징 값 학습(feature learning) 및 주제 모델링(topic modelling)에 사용할 수 있는 알고리즘이다. RBM은 Generative Model이라고 하는데, ANN, DNN, CNN, RNN 등과 같은 Deterministic Model과는 다른 목표를 가지고 있다. Deterministic Model은 타겟과 가설 간의 차이를 줄여 오차를 줄이는 것을 목표로 한다면, Gernerative Model은 확률밀도함수(probability density function, pdf)를 모..

AI 2022.08.17

[AI] LSTM(Long Short Term Memory)

1. 일반적인 신경망 Feed-forward neural networks(FFNets) 데이터를 트레이닝 셋과 테스트 셋으로 나누어서 관리하고, 트레이닝 셋을 통해 신경망의 가중치를 학습시켜 결과를 테스트 셋을 통해 확인하는 방식이다. FFNets에서 데이터를 입력하면 입력층에서 은닉층까지 연산이 진행되고 출력되고, 이 과정에서 입력 데이터는 모든 노드를 한 번씩 지나가게 된다. 데이터가 노드를 한 번만 지나가게 된다는 것은 데이터의 순서(시간적인 측면)를 고려하지 않는 구조라는 의미이다. 데이터들의 시간 순서를 무시하고 현재 주어진 데이터를 통해서 독립적으로 학습한다. 2. 순환 신경망 RNN(Recurrent Neural Networks) 입력과 출력을 시퀀스 단위로 처리하는 Sequence 모델이다..

AI 2022.08.16

[MariaDB] 데이터베이스 옮기기 (dump 파일 생성 및 Database restore)

구성 순서 1. 백업할 데이터베이스 확인하기 2. DB 백업(dump 파일 생성) 3. DB 복구(restore) 1. 백업할 데이터베이스 확인하기 (1) MySQL Client(MariaDB)를 검색해 실행한다. [시작메뉴] - [프로그램 및 파일 검색] 검색창에 "mysql" 검색 (2) password 입력 password를 입력한다. (3) 백업할 database를 확인한다. show databases; 2. DB 백업(dump 파일 생성) DB 백업(dump 파일 생성)하기 위해서는 mariadb-dump.exe 파일이 필요하다. 보통은 아래와 같은 경로에 있을 것이다. C:\Program Files\{DB-name}\bin 해당 폴더에서 명령 프롬프트를 열어 주고, 아래와 같은 명령어로 백업(..

MariaDB 2022.07.19

[AWS] Open VPN을 이용한 AWS EC2 접속

구성 순서 1. Open VPN GUI 설치 2. Open VPN GUI 어플에서 클라이언트 구성 파일 열기(연결) 3. AWS EC2에 접속하는 RDP파일 다운로드 4. 암호 해독 5-1. admin계정 접속 5-2. 사용자 계정 생성 후 접속 1. Open VPN GUI 다운로드 https://openvpn.net/community-downloads/으로 접속해서 해당하는 운영체제로 다운을 받는다. Community Downloads | OpenVPN Visit this page to download the latest version of the open source VPN, OpenVPN. openvpn.net 2. Open VPN GUI 어플에서 클라이언트 구성 파일 열기(연결) [AWS] 관리형..

AWS 2022.07.19

[AWS] 관리형 VPN 설정 방법

구성 순서 1. IAM 사용자 생성 2. AWS 명령줄 인터페이스(AWS CLI) 프로그램 설치 3. aws configure 설정 4. 인증서 생성 (EasyRSA) 5. AWS Certificate Manager에 인증서 가져오기 6. Client VPN 엔드포인트 생성 7. 클라이언트 구성 다운로드 8. 클라이언트 구성 파일 편집 9. Open VPN GUI 다운로드 10. Open VPN GUI 어플에서 클라이언트 구성 파일 열기(연결) 1. IAM 사용자 생성 AWS Certificate Manager(ACM)에 인증서를 업로드 할 수 있는 사용자를 생성하거나 기존 사용자에게 권한을 부여한다. AWSCertificateManagerFullAccess 2. AWS 명령줄 인터페이스(AWS CLI)..

AWS 2022.07.11

[AWS] VPC 구성

VPC 구성 순서 1. VPC 구성 2. VPC 내부 subnet 구성 3. Internet Gateway 구성 4. NAT Gateway 구성 5. 라우팅테이블 설정 1. VPC 구성 - VPC에서 사용하는 사설 아이피 대역 10.0.0.0 ~ 10.255.255.255(10/8 prefix) 172.16.0.0 ~ 172.31.255.255(182.16/12 prefix) 192.168.0.0 ~ 192.168.255.255(192.168/16 prefix) 1) AWS 콘솔에 로그인 한 뒤 VPC 서비스로 들어와서 VPC 생성을 눌러준다. 2) 생성할 VPC의 이름과 CIDR블록을 지정해준다. CIDR은 한번 구성하면 변경할 수 없다. 각각의 VPC는 하나의 리전에 종속되어 완전히 독립적이기 때문에..

AWS 2022.07.08