반응형

Data 96

백준 알고리즘 [파이썬]: 6. 함수 : 15596 정수 N개의 합

6.함수 함수 단계 함수를 구현해 봅시다. (이 문제는 C, C++, Python, Java, Go만 지원합니다. 그 외의 언어를 사용하신다면 이 문제를 무시해 주세요.) www.acmicpc.net #15596 정수 N개의 합 def solve(a): return sum(a) solve=sum Python 함수는 first class 객체이다. 변수에 함수 할당함 함수는 객체타입의 인스턴스 함수에 변수를 저장할수 있다 다른 함수에 파라미터로 넘길 수 있다 함수로부터 함수를 리턴할 수 있다. 자료구조에 함수를 저장할 수 있다.

Data/Python 2021.06.24

10.회귀 분석(Regression Analysis)

지도학습 : 회귀분석(Regression Analysis) 1) 선형 회귀(Linear Regression): 연속형 관측값을 이용하여 연속형 수치 데이터를 선형 모델링통해 예측 가정: 반응변수와 독립변수와의 관계가 선형임을 가정(선형성,Linearity) (1) 단순 선형 회귀(Simple Linear Regression) 하나의 설명/독립변수(explanatory variable x),하나의 반응/종속변수y사이의 관계 모델링, 특성과 타깃사이의 회귀 직선 관계를 나타내는 선형 방정식의 가중치 학습하여 예측 β0 or w0: 절편(intercept) β1 or w1: slope 특성x의 가중치 잔차(Residuals): 실제 관측값과 예측값의 차이 Regression line: 주어진 관측값에서 가장 ..

Data/ML 2021.06.23

백준 알고리즘 [파이썬]: 5. 1차원 배열

5. 1차원 배열-1 1차원 배열 단계 각 숫자가 몇 번 나왔는지 저장하기 위해 일차원 배열을 만드는 문제 www.acmicpc.net #10818 최소, 최대 N = int(input()) arr = list(map(int, input().split())) print(min(arr), max(arr)) #2562 최댓값 arr=[] for i in range(0): arr.append(int(input())) print(str(max(arr))+'\n'+str(arr.index(max(arr))+1)) index : 위치 값 받기(0부터 시작해서 1을 더함) #2577 숫자의 개수 A = int(input()) B = int(input()) C = int(input()) num_list = list(s..

Data/Python 2021.06.22

백준 알고리즘 [파이썬]: 4. While 문

4. While 문 while문 단계 입력이 끝날 때까지 A+B를 출력하는 문제. EOF에 대해 알아 보세요. www.acmicpc.net #10952번 (A+B -5) a,b = map(int, input().split()) while (a!=0 and b!=0): print(a+b) a, b=map(int,input().split()) 0 0 을 입력하면 print 하지 않고 바로 끝남 #10951번 (A+B -4) while True: try: a,b = map(int,input().split()) print(a+b) except: break 입력하지 않고 끝내면 ValueError: not enough values to unpack (expected 2, got 0) 가 나오므로 try ~exce..

Data/Python 2021.06.21

백준 알고리즘 [파이썬]: 3. for문

3.for 문 for문 단계 1부터 N까지의 합을 구하는 문제. 물론 반복문 없이 풀 수도 있습니다. www.acmicpc.net #2739 구구단 i=int(input()) for j in range(1,10): print(i, '*' ,j, '=', i*j) #10950 A+B - 3 for _ in range(int(input())): print(sum(list(map(int,input().split())))) #8398 합 total=0 for i in range(int(input())+1): total += i print(total) #15552 빠른 A+B import sys T = int(sys.stdin.readline()) for i in range(T): a, b = map(int,sy..

Data/Python 2021.06.20

백준 알고리즘 [파이썬]: 2.if문

2.if문 if문 단계 점이 어느 사분면에 있는지 알아내는 문제 www.acmicpc.net #1330 두 수 비교하기 a,b =map(int, input().split()) if a>b: print('>') elif a=90: print('A') elif score >=80: print('B') elif score >=70: print('C') elif score >=60: print('D') else : print('F') #2753 윤년 leap_year = int(input()) if leap_year %4==0 and (leap_year%100!=0| leap_year %400==0) : print(1) else: print(0) #14681사분면 고르기 x=int(input()) y=int(i..

Data/Python 2021.06.19

[Python] Google Colab(코랩) 런타임 연결 끊김 문제 자동 재연결로 해결

Colab(코랩) 런타임 연결 끊김 문제 문제 Google Colab으로 머신러닝을 하다가 잠시 자리 비우고 다른 일 하다오면 런타임이 끊겨 있는 것을 볼 수 있다. 런타임이 끊기면 코드는 돌아가고 있다고 나오나 실제로는 아무것도 실행되지 않는다. 이외에도 크롬으로 다른 작업하는 경우에도 이런 결과가 나왔었다. 코랩의 전체 세션 유지 시간은 12시간이고, 90분 이상 비활성화 되면 자동으로 끊기기 때문에 발생한 것이다. 코랩 프로나 코랩 프로 플러스를 유료 구독하게 된다면 더 빠른 GPU나 TPU에 우선적 엑세스하게 해주고 넉넉한 메모리 , 더욱 긴 런타임을 제공한다. 해결방법 Google Colab을 실행하고 있는 크롬 브라우저 >개발자 도구> 콘솔창에 하단과 같이 입력하고 엔터를 누른다. 특정 주기마..

Data/Python 2021.06.18

8. 감정분석

8. 감정분석 자연어 처리(Natural Language Processing, NLP) :컴퓨터에서 대량의 자연어 데이터 처리하고 분석하도록 프로그래밍 의견분석(Opinoion mining) or 감성 분석(sentiment analysis) - 정서적 상태(감정)와 주관적인 정보(의견)를 체계적으로 식별, 추출, 정량화 및 연구하기 위해 자연어 처리, 텍스트 분석, 전산 언어학 및 생체 인식을 사용 - 특정 주제에 글쓴이의 성향에 따라 텍스트를 극성(감성,의견) 분류하는 방법 응용 :사용자 추천시스템 (의견 ,선호도 기반 ) • 텍스트 데이터의 정제와 준비 : BOW model: 특성 벡터 인코딩, tf-idf사용 적합성 기준 단어 빈도에 가중치 부여 • 텍스트 문서로부터 특성 벡터 구축 • 로지스틱 ..

Data/ML 2021.06.15

7. 앙상블 학습 (Ensemble Learning)

7. 앙상블 학습 (Ensemble Learning) 여러 weak learner를 합쳐 하나의 Strong learner 로 좀 더 객관적인 결과를 얻음(일반화 성능, 안정성 향상,에러 감소) single learner 보다 weak learner 합친것이 나음 예. Boosting, Bagging ,Stacking Ensemble 집계 방식 1> Voting 과반수 투표 (Majority voting) 다수결 투표(Plurality Voting) : 최빈값(mode) 2> Aggregating Average Ensemble model 1) Bagging(Bootstrap AGGregatING): 동일한 모델 병렬 연결하여 일반화 (in parallel) 샘플에서 복원추출(resampling)하여(Bo..

Data/ML 2021.06.14

6. 모델 평가와 하이퍼파라미터 튜닝(미세조정)

Pipeline으로 효율적 워크플로 : 여러개의 변환기와 분류기를 모델 연결 모델 성능 평가 : K겹 교차 검증, Holdout 학습곡선과 검증 곡선: 과대적합/과소적합 분석 ML 세부 튜닝 : 그리드 서치 성능 평가 지표 : 이진 분류: 정확도, 재현율, 정밀도, F-1 점수, ROC, ROC AUC 다중 분류: 마이크로,마크로 평균 정밀도 불균형한 클래스 6.1 Pipeline으로 효율적인 워크플로 Pipeline: meta-estimator, 여러개의 개별 변환기와 추정기를 감싼 Wrapper (연결) fit method호출시 데이터가 중간단계에 있는 모든 변환기의fit, transform차례로 거쳐 추정기 객체에 도달,학습 predict 변환기: 입력에 대해fit, transform method지..

Data/ML 2021.06.14
반응형