본문 바로가기

💻 CS7

파이썬(.py) 파일 exe 실행 파일 만들기 (PyInstaller, 주피터 노트북, ipynb) 파이썬으로 코딩한 파일을 exe 실행 파일로 만들고자 한다. 먼저, 저같은 경우는 주피터 노트북으로 작업한 파일을 실행 파일로 만들기 위해 아나콘다 프롬프트를 사용해 해당 파일을 .py 확장자로 변경 후 실행 파일을 만들었습니다. 일반적인 경우 명령프롬프트(cmd) 창으로 진행하셔도 상관없습니다. 파일 위치로 이동 및 주피터 노트북 파일 -> py 로 변경하기 아나콘다 프롬프트를 실행 후, 해당 파일이 있는 폴더로 이동합니다. cd 명령어를 사용하고, 파일 위치는 폴더 위에있는 부분을 복사하시면 됩니다. 해당 파일로 있는 곳으로 이동 후, 아래 명령어를 통해 ipynb 파일을 py로 변경해줍니다. jupyter nbconvert --to script .ipynb py 파일이 생성된 것을 확인할 수 있습니.. 2024. 1. 3.
주피터 노트북(Jupyter Notebook) 바로 꺼짐 오류 해결법 (자동 종료 문제, 사라짐, 키자마자, 실행, 아나콘다 cmd 커널) 평소처럼 아나콘다의 주피터 노트북을 실행하면 바로 종료되는 현상이 나타났다. 해당 화면에서 아나콘다 프롬프트 아래 주피터 노트북을 클릭하면 주피터노트북 cmd 창이 켜지자마자 종료된다. 해결법을 찾던 도중, 아나콘다 프롬프트는 문제없이 켜지는 것을 확인하고 pip install markupsafe==2.0.1 아나콘다 프롬프트에 해당 버전을 다운로드하고 다시 실행시 정상 작동 된다. 2024. 1. 2.
[ML] 선형회귀의 score 값의 의미? (R-squared 결정계수 vs RMSE) 선형 회귀 모델을 사용하게되면, 선형회귀의 성능을 측정하는 score 값을 사용하게 되는데 해당 값이 의미하는게 정확히 무엇일까? 결론부터 말하면, R-squared 값으로 결정계수, 설명력이라고 불리는 값이다. R2 Score와 RMSE Score 차이점 R2 = 결정계수, 설명력, R-squared, R^2 RMSE = 평균제곱근 오차, Root Mean Square Error R2(R-squared) : 독립 변수가 종속 변수를 얼마나 잘 설명하는지 보여주는 지표 -> 쉽게 말하면, 모델로 만들어진 회귀식이 얼마나 잘 예측(설명) 하는지에 대한 지표 -> 범위는 0 ~ 1 사이의 값으로, 1이면 오차가 없는 것(다 맞춤) / 0 이면 전혀 예측을 못하는 것(= 평균으로 찍어도 같음) -> 음수면 평.. 2022. 12. 12.
[Python] 다중공선성(Multicollinearity) 의미, 변수 제거 이유 데이터 분석을 하다보면, 회귀에서 나오는 개념 중 하나인 다중공선성 단순히 다중공선성을 없애야 된다고만 알고 있었는데, 사실 많은 의미를 담고 있는 '다중공선성'에 대해 알아보았다. 다중공선성 먼저 다중공선성이란, 회귀 분석에서 사용된 모델의 일부 변수가 다른 변수와 상관 정도가 높아, 데이터 분석에 부정적인 영향을 주는 것을 말한다. 그럼, 여기서 데이터 분석에 주는 부정적인 영향이란 무엇일까? 회귀분석 우선, 회귀분석이 무엇인지 알아야하는데 단순선형회귀 : Y = aX 다중선형회귀 : Y = aX1 + bX2 + cX3 + ... + zXn 회귀는 이처럼 하나의 독립변수 또는 여러 독립변수로 종속 변수를 예측하는 것을 말한다. 여기서 a, b, c 와 같은 알파벳은 추정량을 의미하며, X1, X2는 .. 2022. 12. 7.
[Python] 소수 판별 알고리즘 (feat. 에라토스테네스의 체, 프로그래머스 소수찾기) 코딩테스트를 준비하며, 소수를 판별하는 알고리즘이 종종 필요했음.단순히 하나씩 보는 것보다 보다 효율적인 방법(에라토스테네스의 체) 을 통해 시간 복잡도를 개선하고자 함.  하나씩 다 확인하는 방법 (비효율)#하나씩 확인하는 방법#2부터 (x - 1)까지의 모든 수를 확인def is_primenum(x): #x가 소수인지 확인하는 알고리즘 for i in range(2, x): if x % i == 0: return False return True#하나씩 확인하는 방법for i in range(2, x): if x % i == 0: print('%d는 소수가 아닙니다.' %x) break if i == x-1: print('.. 2022. 12. 5.
[ML] 랜덤포레스트(Random Forest) 개념 (배깅, 특성 중요도, 엑스트라트리) 랜덤포레스트, Random Forest : 무작위 숲 -> 여러 의사결정트리(Tree)로 생성된 앙상블 모델(숲) 의사결정트리는 훈련 데이터에 따라 생성되는 모델이 다르고, 과적합 문제가 있다. 이를 해결하기 위한 방안으로 여러 의사결정트리를 구성해 평균(회귀) 또는 최빈값(분류)을 통해 학습하는 앙상블 모델 배깅(bagging) = 중복을 허용한 샘플링 랜덤포레스트는 배깅에 의사결정트리를 넣은 모델 -> 랜덤포레스트 모델이 최적화 되어있어 더 편리하다. 랜덤포레스트는 의사결정트리와 배깅 분류 매개변수를 모두 갖고 있음. 랜덤포레스트는 훈련 데이터를 샘플링하고 모든 특성에 대해 정보이득을 계산해 가장 높은 특성을 split 노드로 선택해 가장 최선의 특성을 선정 -> 특성 중요도를 파악하기 쉽다. / 연.. 2022. 11. 29.