In my opinion, machine learning is strictly a subfield of statistics. However.
it is not what it appears to be. Historically, machine learning has developed almost independently of statistics, and in some cases machine learning has reinvented the same methods and given them different names.
In some cases, the same methods have been reinvented and given another name, or machine learning has developed independently of statistics.
In other cases, the method was developed without the involvement of a statistician, but with a completely new idea.
The classic statistics emerged from the needs of governments involved in the census and agriculture.
Census data and the needs of the agricultural community. Machine learning was developed later and
emerged primarily as a product of computer science. Early computer scientists, in turn
and early computer scientists came from physicists and engineers. Thus, DNA is an entirely different
and could solve the same problem.
The same problem.
'Machine learning has become an umbrella term that covers a wide range of disciplines, from classification to clustering.'
classification to clustering and much more. Therefore, I would like to give you a really
clearly defined. However, there are some common characteristics that
seem to be common to almost all machine learning algorithms.
They are all done with the help of a computer, and that computer performs the computations
All of these are done with the help of a computer, and it is impossible to perform these calculations manually.
Data is used as input. If the system is simulated based on an ideal model
model, then it is not machine learning.
The data points are considered samples from a potential "real world" probability distribution.
world" probability distribution.
The data is in tabular form (or at least can be thought of as such). One row for each data point.
There is one row for each data point and one column for each feature. Features are numeric.
Binary or categorical.
The last of these features is really the most important one. Most machine learning algorithms
Machine learning algorithms are designed to handle almost any tabular data, but can only
handle tabular data.
Tabular data is suitable for a variety of mathematical analyses because
Rows of a table with n rows and d columns can be treated as positions in a table with n rows.
Machine Learning Overview
d-dimensional space can be considered. Therefore, machine learning is by far the mathematically
It is the most difficult task.
In most machine learning applications, data points are considered to be derived from an underlying distribution, and the goal is to
In most machine learning applications, data points are considered to be drawn from an underlying distribution, and the goal is to find a sample pattern.
Finding a pattern in a sample tells us something about the distribution as a whole, or allows us to process other samples from that distribution.
it can handle other samples from that distribution.
The next post, and some of the later posts, will
some of the major areas of machine learning. The purpose of this post,
This post provides background on machine learning as a whole and
some of the techniques that affect all parts of machine learning.
私の考えでは、機械学習は厳密には統計学の下位分野です。しかし
それは見かけによらない。歴史的に見ると、機械学習
は統計学とはほぼ独立して発展してきたし、場合によっては機械学習が同じ手法を再発明して別の名前をつけていることもある。
同じ手法が再発明されて別の名前が付けられたり、機械学習が統計学とは無関係に発展したケースもある。
また、統計学者が関与せず、全く新しい発想で手法が開発されたケースもある。
古典的な統計は、国勢調査や農業に関わる政府のニーズから生まれました。
国勢調査のデータと農業関係者のニーズ。機械学習は後から開発され
機械学習は、主にコンピュータサイエンスの産物として登場しました。初期のコンピュータ科学者は、順番に
と初期のコンピュータ科学者は、物理学者とエンジニアから生まれた。このように、DNAは全く異なる
であり、同じ問題を解決することができた。
同じ問題を
「機械学習は、分類からクラスタリングまで、幅広い分野をカバーする包括的な用語になっている」。
分類からクラスタリングまで、多岐に渡る。したがって、私は皆さんに、本当に
を明確に定義する。ただし、以下のような共通の特徴があります。
ほとんどすべての機械学習アルゴリズムに共通しているようです。
それらはすべてコンピュータの助けを借りて行われ、そのコンピュータが計算を実行します
これらはすべてコンピュータの助けを借りて行われるものであり、これらの計算を手動で行うことは不可能である。
データは入力として使われる。理想的なモデルに基づいてシステムをシミュレートするのであれば、それは機械学習ではありません。
モデルに基づいてシミュレーションされた場合は、機械学習とは言えません。
データポイントは、潜在的な「実世界」の確率分布からのサンプルとみなされる。
実世界」の確率分布のサンプルと考える。
データは表形式(あるいは少なくともそのように考えることができる)である。各データポイントに1行。
各データポイントには1行、各特徴には1列がある。特徴は数値である。
二値またはカテゴリ。
これらの特徴のうち、本当に重要なのは最後の特徴である。ほとんどの機械学習アルゴリズム
機械学習アルゴリズムは、ほぼすべての表形式データを扱えるように設計されていますが、表形式データしか扱えません。
表形式データしか扱えない。
表形式データが様々な数学的分析に適しているのは、以下の理由による。
n行d列の表の行は、n行の表の位置として扱うことができる。
機械学習の概要
88 6 機械学習の概要
d次元空間を考えることができる。したがって、機械学習は圧倒的に数学的に
最も難しい課題である。
ほとんどの機械学習アプリケーションでは、データポイントは基礎となる分布から導き出されると考えられ、その目標は
ほとんどの機械学習では、データ点は基礎となる分布から引き出されたものと考えられ、目標はサンプルのパターンを見つけることである。
サンプルのパターンを見つけると、分布全体について何か分かるし、その分布から他のサンプルを処理することも可能になる。
No comments:
Post a Comment
Thank you for Contacting Us.