본문 바로가기

카테고리 없음

AI 시스템을 구축하는 방법을 설명하는 간단한 방법

ai 시스템 구축하는 방법

 

이 블로그에서는 AI 시스템을 구축하는 방법을 살펴보겠습니다. 마찬가지로, 블로그가 기초 이해를 위해 작성되었으므로 기술적인 세부 사항에 대해서는 자세히 다루지 않을 것입니다. AI 시스템을 구축하는 것은 소프트웨어가 자동으로 개선되지 않는 기존의 컴퓨터 프로그래밍과 다릅니다. 좋은 AI 엔진의 원리:또한 AI 시스템을 구축하는 것이 훨씬 덜 복잡할 뿐만 아니라 훨씬 저렴 해졌다는 사실을 깨닫는 것이 필수적입니다. Amazon Machine Learning 이 그 한 예입니다. 제품 설명 데이터를 교육 세트로 사용하여 카탈로그의 제품을 자동으로 분류하는 데 도움이 됩니다. 최신 AI 기사:사례 : 모델을 생성하는 데 20시간의 컴퓨팅 시간을 사용하고 한 달 동안 890000개의 실시간 예측을 얻었다고 상상해 보십시오. 이것은 단지 $100의 비용이 들었을 것입니다. 이 짧은 글의 범위를 지정하기 위해 대부분의 응용 프로그램을 수신하는 영역인 기계 학습(ML)에 중점을 둘 것입니다. 주목해야 할 한 가지 중요한 점 은 통계에 대한 올바른 이해가 AI의 유익한 시작이라는 점입니다. AI 시스템 설계 단계 문제를 식별합니다. 데이터를 준비합니다. 알고리즘을 선택합니다. 알고리즘을 훈련시킵니다. 특정 프로그래밍 언어를 선택하십시오. 선택한 플랫폼에서 실행합니다. 1. 문제 식별 무엇보다도 가장 중요한 질문은 (1) " 무엇을 해결하려고 합니까?"입니다. (2) “ 원하는 결과는 무엇입니까?” 하지만 AI 자체 가 만병통치약이 될 수는 없다는 사실을 지속적으로 상기해야 합니다. 전체 설루션 자체가 아니라 도구입니다. AI로 해결해야 할 몇 가지 기술과 다양한 문제가 있습니다. 위의 내용을 설명하는 데 도움이 되는 이 비유를 생각해 보십시오. 맛있는 요리를 만들고 싶다면 무엇을 요리할 것인지와 필요한 모든 재료를 정확히 알아야 합니다. 2. 데이터 준비 우리는 데이터를 봐야 합니다. 데이터는 정형 및 비정형의 두 가지 범주로 나뉩니다. 구조화된 데이터는 처리의 일관성과 분석의 용이성을 보장하기 위해 엄격한 형식을 따릅니다. 즉, 이름, 성, 생년월일, 주소 등이 포함된 고객 기록입니다. 비정형 데이터 가 전부입니다. 데이터는 균일하지 않은 패턴으로 유지됩니다. 여기에는 오디오, 사진, 이미지, 단어 및 인포그래픽이 포함될 수 있습니다. — 이메일, 전화 대화, WhatsApp, WeChat 메시지와 같은 예. AI의 가장 큰 유틸리티이자 혁신 중 하나는 컴퓨터가 구조화되지 않은 데이터를 분석하고 구조화된 데이터의 세계보다 훨씬 더 큰 정보 우주에 액세스 할 수 있도록 하는 것입니다. 종종 우리는 AI의 핵심 요소가 복잡한 알고리즘이라고 생각합니다. 그러나 실제로 AI 도구 키트의 가장 중요한 부분은 데이터를 정리하는 것입니다. 데이터 과학자가 실제로 단일 알고리즘을 사용하거나 작성하기 전에 데이터를 정리, 이동, 확인, 구성하는 데 시간의 80% 를 보내는 것은 지극히 정상입니다. 엔터프라이즈 및 대기업은 방대한 독점 데이터베이스를 보유하고 있으며 데이터는 AI에 적합하지 않을 수 있으며 데이터가 사일로에 저장되는 것이 매우 일반적입니다. 이로 인해 정보가 중복될 수 있으며 일부는 일치하고 일부는 모순될 수 있습니다. 데이터 사일로는 결국 회사가 내부 데이터에서 빠른 통찰력을 얻는 데 제한을 줄 수 있습니다. 모델을 실행하기 전에 데이터가 정리되고 정리되었는지 확인해야 합니다. 실제로 일관성을 확인하고, 시간 순서를 정의하고, 필요한 경우 레이블을 추가하는 등의 작업을 수행해야 합니다. 일반적으로 데이터를 더 많이 마사지할수록 정의된 문제를 해결하기 위한 결과를 제공할 가능성이 높아집니다. 3. 알고리즘 선택 우리는 기술적인 세부 사항으로 들어가지 않을 것이지만(이 글의 범위를 벗어남), 적어도 선택한 학습 유형에 따라 달라지는 다양한 공통 유형의 알고리즘을 이해하는 것이 필수적입니다. 기본적으로 분류는 레이블을 예측하는 것이고 회귀는 수량을 예측하는 것입니다. 분류 알고리즘을 사용하는 예는 대출이 채무 불이행 가능성이 있는지 여부를 이해하려는 경우 시나리오가 될 수 있습니다. 회귀 알고리즘을 사용하는 예는 채무 불이행 대출에 대한 예상 손실 금액을 수량화하려는 경우 시나리오가 될 수 있습니다. 이러한 맥락에서 당신은 가치를 찾고 있습니다. 대출 불이행 시 손실될 것으로 예상되는 달러 금액은 얼마입니까? 문제를 식별하면 알고리즘을 선택할 수 있습니다. 이러한 예는 단순하며 실제로는 현실과 거리가 멉니다. 랜덤 포레스트 , 나이브 베이즈 분류 , 지원 벡터 머신 및 로지스틱 회귀와 같은 지도 학습에서 선택할 수 있는 다른 알고리즘이 있습니다. 그럼에도 불구하고 이러한 예는 AI의 알고리즘 유형을 이해하는 데 도움이 됩니다. 2. 비지도 학습 및 강화 학습 알고리즘의 유형은 다를 수 있으며 알고리즘이 객체를 그룹화하려고 시도하는 클러스터링, 객체 간의 링크를 찾을 때의 연관, 노이즈를 줄이기 위해 변수 수를 줄이는 차원 축소와 같은 여러 범주로 분류할 수 있습니다. 4. 알고리즘 훈련 알고리즘을 선택한 후에는 데이터를 모델에 입력하는 모델을 훈련해야 합니다. 여기서 중요한 단계는 모델 정확도입니다. 널리 허용되거나 국제화된 임계값은 없지만 선택 프레임워크 내에서 모델 정확도를 설정하는 것이 매우 중요합니다. 허용 가능한 최소 임계값을 설정하고 훌륭한 통계 원칙을 적용하는 것이 핵심입니다. 모델은 미세 조정이 필요할 수 있으므로 자연스럽기 때문에 모델을 다시 훈련시켜야 합니다. 모델 예측 가능성이 감소하는 이벤트를 고려하십시오. 따라서 모델을 다시 작업하고 이전에 언급한 모든 다른 단계를 확인해야 합니다. 5. 그렇다면 AI를 위한 최고의 프로그래밍 언어는 무엇일까요? 짧은 대답은 이것이 귀하의 필요와 다양한 요인에 달려 있다는 것입니다. 아시다시피, 고전적인 C++ 및 Java에서 Python, R에 이르기까지 많은 프로그래밍 언어가 있습니다. Python과 R은 사용자에게 광범위한 기계 학습 라이브러리를 포함한 강력한 도구 세트를 제공하기 때문에 더 인기 있는 코딩 언어입니다. 매우 유용한 라이브러리 중 하나는 NLTK입니다. 직접 프로그래밍하는 대신 Python으로 작성된 자연어 도구 키트입니다. 6. 선택된 플랫폼 자체 서비스, 데이터베이스 등을 구매하는 대신 모든 서비스를 제공하는 플랫폼을 선택하십시오. 기성 플랫폼인 서비스로서의 기계 학습은 기계 학습의 확산을 도운 가장 유용한 인프라 중 하나였습니다. 이러한 플랫폼은 기계 학습을 단순화하고 용이하게 하기 위해 구축되었으며, 종종 여러 알고리즘 및 여러 언어와 함께 사용하고 통합할 수 있는 클라우드 기반 고급 분석을 제공합니다. 신속한 배포도 MLaS 성공의 핵심입니다. 플랫폼은 일반적으로 데이터 사전 처리, 모델 교육, 평가 예측과 같은 문제에 도움이 되지만 다양하며 일부 사전 평가가 핵심입니다. 더 인기 있는 플랫폼에는 Microsoft Azure Machine Learning , Google Cloud Prediction API , Tensor Flow , Ayasdi 등이 있습니다.


loading