본문 바로가기

3rd/클라우드 컴퓨팅과 비정형 데이터 분석4

[2023/04/14][7주차] Recurrent Neural Network 순차적인 데이터를 분석 Sequential Modeling CNN에서는 이미지를 분석하였고 RNN에서는 순차적인 데이터를 분석 시계열(time serial) 데이터와 조금 다름 주가는 타임스탬프가 찍혀 있고 정확한 시간 단위가 데이터가 있음 시계열 데이터는 sequential modeling에서 나온 개념임 (수업에서)데이터에 순차를 우선순위로 고려하여 진행 index order 위주로 데이터를 분석 지금까지 두 가지 형태의 뉴럴 네트워크를 학습 Fully Connected 모든 노드가 연결 Convollutional layer (특히)이미지 데이터를 다루기 위해 나왔고 모든 노드의 값을 보는게 아니라 국지적으로 몇 개 노드만 선택하여 특징을 도출 Recurr.. 2023. 4. 14.
[2023/04/07][6주차] 클라우드 컴퓨팅 Lecture Note 5 Support Vector Machine SVM도 결정경계(decision boundaries)를 만들어주는 모델 Margin-based Decision Boundary Hyperplane을 정의할 때 Positive Sample Negative Sample 두 분류를 알 수 있음 Margin: 선과 직선(Hyperplane)의 거리 linear decision boundary가 training dataset을 완벽하게 분류할 수 있다고 할 때 현실적으로 data를 완벽하게 분류할 수 없기 때문에 에러를 가능한 적게 해줘야함 Error Handling 페널티를 각각에 에러에 부여 기존 Objective func: y(w*x - b >= 1), min ||w|| modified .. 2023. 4. 9.
[2023/03/17][3주차] In3.pdf Linear Regression 우리의 관측값을 잘 설명하는 모델의 파라미터를 찾고자 함 MSE를 최소화 시키는 모델 파라미터(weight, bias)를 찾음 Model Parameter: w, b Logistic Regression 선형 회귀에서는 입력값에 대한 출력값이 스칼라 였는데, 2차원의 입력값에 대한 출력값이 0또는1인 분류값이 됨 (binary classification) decision boundary 값을 찾고, 결정 경계를 기준으로 입력값을 분류하고 싶음 입력값에 대한 출력값이 1인 조건부 확률을 구함 5p) 노트 참조 선형 회귀에서는 MSE가 0에 가까워지게 모델을 학습 시켰고, 실제 Y값이 있었고, Yhat 과의 차이를 최소화하기 위해서 Loss Function을 MS.. 2023. 3. 17.
[1주차] Intro weonyoungjoo@ewha.ac.kr 평가 Term Project ONLY Task를 정하고 왜 해당 Task를 정했는지 얘기하고 무엇을 얻고 싶은지 얘기 예비 발표(중간고사) 20% 문제가 무엇인지 카드분야에서 카드상품을 고객에게 추천해줘야 함 고객의 니즈를 충족하는 카드상품을 추천해줘야 카드 사용률이 올라가기 때문 카드이용내역을 분석하여 카드상품을 추천(?) 해당 문제를 해결할 수 있는 데이터를 얻을 수 있는지, 계산 가능한지 고려 본 발표(기말고사) 70% 데이터를 통해 인사이트를 얻고, 그것을 주장하기 위하여 뒷받침할 수 있는 근거를 찾는 것 선택한 문제를 해결 문제를 해결한 것에 대해 논리적인 주장이 있고 주장에 대한 타당한 근거가 필요 몇가지 분석 알고리즘을 활용 각 알고리즘을 비교 분.. 2023. 3. 3.