KFServing (KServe)
KFServing, Transformer, Predictor, Explainer
Last updated
KFServing, Transformer, Predictor, Explainer
Last updated
๋ณธ ๋ฌธ์๋ KServe 0.8 ๋ฒ์ ๊ธฐ์ค์ผ๋ก ์์ฑํ์๋ค.
KServe๋ Kubernetes์ ML Model์ Deployํ๊ณ Serving ๊ธฐ๋ฅ์ ์ ๊ณตํ๋ Model Inference Platform์ด๋ค.
InferenceService CR ์์ฑํ๊ณ Kubernetes API Server์ ๋ฑ๋กํ๋ฉด, Transformer, Predictor, Explainer ๋ฑ์ ์์ฑํ์ฌ Inference Service ๋ฅผ ๊ตฌ์ถํ ์ ์๋ค. Knative Serverless๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํธ๋ํฝ์ด ์์ ๋๋ scale-to-zero ๋์ํ๋ค.
Inferenceํ ๋ฐ์ดํฐ์ ์์น๋ฅผ ์ ์ํ๋ค. Predictor์ ML Framework spec์ ์ ์ํ ํ endpoint spec์ ์์ฑํ๋ค. ์์ฑํ endpoint spec์ InferenceService Metadata spec์ ์์ฑํด InferenceService๋ฅผ ์์ฑํ๋ค.
KF Serving ๊ตฌ์ฑ์์๋ Endpoint, Transformer, Predictor, Explainer ๊ฐ ์์ผ๋ฉฐ Endpoint ๋ง๋ค Explainer ๋ฅผ ๊ตฌ์ฑํ๊ณ ํ์์ ๋ฐ๋ผ Transformer, Explainer ๋ฅผ ์ถ๊ฐํ ์ ์๋ค.
InferenceService๋ Default Endpoint์ Canary 2๊ฐ๋ฅผ ์ ๊ณตํ๋ฉฐ, Rollout ์ ์ฑ ์ ์ ์ํ์ฌ ํธ๋ํฝ ๋น์จ์ ์กฐ์ ํ ์ ์๋ค.
์ฌ์ฉ์๊ฐ Predictor๋ Explainer ์ํ ์ ํ์ ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ, ํ์ฒ๋ฆฌ ํ ์ ์๋ค.
ML Model Server๋ก ๋ฐ์ดํฐ๋ฅผ ์์ธกํ๊ฑฐ๋ ๋ถ๋ฅํ๋ ์ญํ ์ ํ๋ค.
XAI๋ก ๋ฐ์ดํฐ๋ฅผ ์์ธกํ๊ฑฐ๋ ๋ถ๋ฅํ ๊ฒฐ๊ณผ์ ๋ํด ํ๋จ ์ด์ ๋ฅผ ์ ์ํ๋ ์ญํ ์ ํ๋ค.
https://kserve.github.io/website/ https://www.kubeflow.org/docs/components/kfserving/ https://devocean.sk.com/blog/techBoardDetail.do?ID=163739
KFServing ์์ ์ ๊ณตํ๋ Endpoint, Transformer, Explainer, Predictor ์ธ์ ๋ ๊ตฌ์ฑ์์๋ฅผ ์ถ๊ฐํ ์์ ์ด๋ฉฐ, Outlier Detection ๋ ๊ทธ ์ค ํ๋์ด๋ค.
API | Method | Path | Payload |
---|---|---|---|
Readiness
GET
/v1/models/
Response:{"name": , "ready": true/false}
Predict
POST
/v1/models/:predict
Request:{"instances": []} Response:{"predictions": []}
Explain
POST
/v1/models/:explain
Request:{"instances": []} Response:{"predictions": [], "explainations": []}