데이터 분석 2

생성형 AI. 앞으로는 어떻게 될까?

생성형 AI의 등장 후 앞으로는 어떻게 될까? chatGPT의 등장으로 많은 기회가 생겼고 LMM의 민주화가 시작됐습니다. chatGPT가 나온 후로는 데이터레이크를 다루는 부분에 대한 기업의 인식과 프로세스가 많이 바뀌었습니다. 앞으로는 기업들이 자체적인 온프레미스를 구축하기 위해서 많은 리소스를 투입할텐데 이때 가장 중요것은 데이터셋이 됩니다. 그러면서 데이터레이크에 대한 인식이 개발자만이 아닌 기업의 운영진들도 데이터의 중요성을 gpt의 등장으로 인식하게 됐기때문입니다. 그럼 그냥 ChatGPT쓰면 안돼?! 기업입장에서는 오픈된 생성형 AI들을 쓰게되면 무엇보다 데이터보안적인 측면에서 좋지 않습니다. 내부적으로 프롬프트에대해서 학습을 하고 있을것이 뻔하기 때문이죠 그럼 이 파운데이션 모델로 우리가 ..

데이터 분석 2024.01.25

벡터와 시리즈 기초 개념

시리즈 판다스에서 1차원 데이터를 담는 시리즈 자료형을 제공한다. 1차원 데이터 배열, 인덱스와 값을 가지는 데이터 구조. 시리즈는 열 단위로 데이터를 다루는 데이터프레임에서 각 열을 나타내는 자료형 데이터를 일련의 레이블(인덱스)에 매핑합니다. NumPy 배열과 비슷한 구조이나, 인덱스를 사용하여 각 데이터에 접근할 수 있습니다. 데이터의 순서가 보장됩니다. 예시 `import pandas as pd` # 데이터와 인덱스를 지정하여 시리즈 생성 s = pd.Series(\[1, 2, 3, 4\], index=\['a', 'b', 'c', 'd'\]) print(s) 결과 a 1 b 2 c 3 d 4 dtype: int64 백터 2차원 배열이며 다음과같이 예시를 들 수 있습니다. 벡터는 순서쌍(order..

데이터 분석 2023.04.04