Good Bye~ human...…
This is the title of a Korean translation version of an artificial intelligence-related book. It is quite provocative. It's not that much, but it looks like we'll have to say goodbye to analog and existing stereotypes at least now.
This year is almost coming to an end. At the same time, it is expected that a new leader will appear in the near future due to the presidential election. Macroscopically, the wave of fundamental paradigm change appears to be high. We will be so excited because it is also a time of opportunity. On the other hand, it's also confusing. It is like the appearance of automobiles in the age of carriages. The red flag law was enacted in Britain at the time in response to the opposition from the establishment. As a result, the flag bearer had to lead the car 55 meters ahead. It was a typical anachronism system. This should be avoided. Rather, ideas that lead change and innovative social infrastructure are needed. Traditional cars are also doomed to disappear. Unmanned vehicles and electric vehicles are the trend. Underneath it lies artificial intelligence.
What is the core of the future society? First of all, it will be artificial intelligence. So, what is artificial intelligence? The dictionary definition refers to the artificial reproduction of human abilities. It is still ambiguous. In particular, artificial intelligence in the deep learning stage beyond machine learning is more confusing. So what is deep learning? It's a hard question. Let's define it simply. This means a series of processes to find meaningful patterns in data. It presupposes human-made hypotheses and models. It is a spontaneous maze game of artificial intelligence within this framework. What is the most important thing in this process? Herein lies the essence of artificial intelligence. It is none other than high-quality Big Data.
This has great implications. In other words, high-quality big data itself is artificial intelligence. This fact should be noted. Accordingly, the competitiveness of AI depends on the quantity and quality of data. Data is our asset, our money, and that's all and everything. That's why data is so important. It is unfortunate, however, that most of us, or at least some of us do not fully understand this. In particular, the lack of awareness of the policy authorities in charge of the nation's future is fatal.
So, how will data be produced and managed? The answer is simple. It is the establishment of an open data system. Computer programs are composed of mostly open source software. The same goes for data. It is also necessary to build a social infrastructure that can be shared by many people. It is fortunate that it is a field that can lead the most at the national level rather than a multinational corporation. Before Google country(?) and Apple country(?) both take the lead, it is necessary for the Korean government to take proactive measures at the pan-government level. The easiest way is the full disclosure of public data. In addition, private information should be disclosed as much as possible. Of course, there needs to be an appropriate balance between privacy and access to data. But it will not be appropriate to take an excessive conservative position. Policies that focus too much on personal information protection like the present one should be avoided.
What will reality be like? In the case of domestic public data, formally, there is also a portal. Also, some data is made public. However, the quantity and quality are absurdly insufficient, and the method of disclosure is not backwards. In particular, disclosure in the form of Open API is important. the easy access will be a key. However, recognition of this importance by the authorities in charge of public data is absolutely lacking. Open API can be said to be the core of the artificial intelligence industry. This is the nourishment for and the core of new innovative start-ups. Without high-quality big data, the birth of artificial intelligence is not feasible. This is because the reality of artificial intelligence is big data.
Therefore, fundamental innovation is needed starting with the public data system. We need to get out of the old stereotypes. It must be completely changed to be consumer-friendly. The quantity and quality of data, including public data, determines the IQ of artificial intelligence. This is directly related to competitiveness. Public institutions such as the government have relatively large amounts of data. Therefore, all public information should be disclosed as far as possible. In addition, it should be appropriately disseminated to domestic startups or potential companies. It is important to build a social infrastructure for this purpose.
Take the legal field as an example. At present, legal reform is a hot topic. What should be done for this? Other policy developments are incidental (?). There is an easy way. It is the disclosure of various direct or indirect judicial data. All judicial-related materials, systems, procedures, and forms, etc. must be disclosed. That makes it easier for law enforcement as well. In addition, it has an absolute impact on judicial reform and further development of related industries. However, the perception of law enforcement officials is anachronistic. It is also evident in some of them, such as judgments. However, in the case of the Constitutional Court, the public data portal provides judgment data, etc. as Open API. But the Supreme Court does not. Of course, there could be several reasons. However, there seems to be a clear lack of awareness of this. Accordingly, the judicial system and related future industries appear to be inevitably dark.
For reference, in the case of the United States, all materials submitted to courts are publicly available as public documents. It is based on the Public Documentation theory. Accordingly, all judgments can be easily searched on Google, etc. Thus, the digitalization of the judicial-related data industry as well as the judicial system is inevitably accelerated. It will also contribute to the development of the artificial intelligence industry as well. However, unless these data are monopolized by some authorities and otherwise shared with the public, Korea will inevitably fall behind. Unfortunately, this reality will accelerate the backwardness of offline justice as well.
Also, data in the private data realm should be open. It is necessary to build a social system that can be shared. There is a need to lead to an overall open data system. For example, in the case of multinational companies such as Google, certain regulations are also required in the case of information acquired in Korea. Information obtained in Korea is disclosed to Koreans or companies within a certain range. It needs to be encouraged to be shared. It is a matter which requires a gradual improvement of the law. This is true not only for foreign companies, but also for domestic companies. This is because information obtained from the public must be shared to some extent in the same context. Now, the creation and disclosure of data. Being open and co-sharing should be at the heart of any policy.
Fortunately, awareness of the importance of coding and the like is gradually spreading. On the other hand, awareness of the importance of data is still absolutely insufficient. If artificial intelligence is important, think only of data (if possible, big data). we need to keep in mind that data itself is artificial intelligence.
인간이여 안녕……
어느 인공지능관련 번역책의 제목이다. 상당히 도발적이다. 그 정도는 아니지만 이제 적어도 아날로그와 기존의 고정관념과는 안녕을 해야 할 모양이다.
다사다난한 한 해가 거의 마무리되는 시점이다. 떄 마침 대선정국으로 조만간 새 지도자의 등장도 예상된다. 거시적으로는 근본적인 패러다임의 변화의 물결이 높다. 그 만큼 설렌다. 기회의 시간이기도 하다. 또한 혼란스럽다. 마치 마차시대에 자동차가 등장하는 양상이다. 기득권의 반발에 당시 영국에는 붉은 깃발법이 생겼다. 이에 자동차는 55미터 앞에 기수가 선도해야 했다. 대표적 시대착오 제도였다. 이는 피해야 한다. 오히려 변화를 선도하는 발상과 혁신적 사회인프라가 필요하다. 이제 전통적 자동차도 사라질 운명이다. 무인화와 전기자동차가 대세다. 그 저변에는 인공지능이 자리잡고 있다.
미래사회의 핵심은 무엇일까? 무엇보다 인공지능이다. 그렇다면 인공지능은 무엇인가? 사전적 정의는 인간의 능력을 인공적으로 재현한 것을 말한다. 여전히 애매하다. 특히 머신 러닝을 넘어 딥러닝 단계의 인공지능은 더 혼란스럽다. 그렇다면 딥 러닝이 무엇일까? 어려운 질문이다. 간단하게 정의해보자. 이는 데이터에서 유의미한 패턴을 찾아가는 일련의 과정을 의미한다. 이는 인간이 만든 가설과 모델을 전제로 한다. 이 틀안에서의 인공지능의 자발적 미로게임인 셈이다. 이 과정에서 가장 중요한 것이 무엇일까? 여기에 인공지능의 본질이 숨어 있다. 그것은 다름아닌 양질의 빅 데이터(Big Data)이다.
이는 시사하는 바가 크다. 거두절미하면 양질의 빅 데이터가 바로 인공지능인 셈이다. 이 사실에 주목해야 한다. 이에 따라 인공지능의 경쟁력은 데이터의 양과 질에 달려있다. 데이터가 자산, 돈이고 그 모든 것이다. 그만큼 데이터가 중요하다. 다만 이를 제대로 이해하지 못하고 있는 현실이 안타깝다. 특히 국가의 미래를 담당하는 정책당국들의 인식 결여자체가 가히 치명적이다.
그렇다면 데이터를 어떻게 생산하고 관리할 것인가? 그 해답은 간단하다. 바로 오픈 데이터(Open Data)시스템의 구축이다. 컴퓨터 프로그램은 오픈 소스 소프트웨어가 대세이다. 데이터도 마찬가지다. 역시 많은 사람이 공유할 수 있는 범사회적 인프라의 구축이 필요하다. 다국적 기업보다 국가차원에서 가장 선도할 수 있는 분야인 점이 그나마 다행스럽다. 구글국가(?)나 애플국가(?)가 모두 선점하기 전에 범정부차원의 선도적 조치가 필요하다. 가장 손쉬운 방법은 공공데이터의 전면공개이다. 그리고 사적 정보도 가능한 최대한 공개돼야 한다. 물론 개인정보보호와 적정한 균형이 필요하다. 그러나 너무 보수적인 것은 위험하다. 현재와 같이 지나치게 개인정보보호에 치중하는 정책은 지양돼야 한다.
현실은 어떠할까? 국내 공공데이터의 경우 형식적으로는 포탈도 있다. 또한 일부 데이터는 공개된다. 그러나 그 양과 질도 터무니 없이 미흡하고 그 공개방법도 후진성을 못한다. 특히 오픈 에이 피 아이(Open API)형태로의 공개가 중요하다. 그런데 이에 대한 인식이 절대적으로 부족하다. 오픈 에이 피 아이는 인공지능산업에서 그 핵심이라고 할 수 있다. 이야 말로 새로운 혁신 스타트 업 기업의 자양분이며 또한 그 핵심이다. 양질의 빅 데이터가 없으면 인공지능의 태동은 무의미하다. 왜냐하면 인공지능의 실체가 바로 빅 데이터이기 때문이다.
따라서 공공데이터 시스템부터 근본적인 혁신이 필요하다. 고루한 기존관념에서 벗어나야 한다. 소비자친화적으로 완전히 바뀌어야 한다. 공공데이터를 비롯한 데이터의 양과 질은 인공지능의 아이큐(IQ)를 결정한다. 이는 경쟁력과 직결된다. 정부 등 공공기관은 상대적으로 많은 데이터를 가진다. 따라서 모든 공공정보는 가능한 한 공개돼야 한다. 또한 국내 스타트 업 기업 또는 잠재 기업에 적정하게 보급돼야 한다. 이를 위한 사회적 인프라 구축이 중요하다.
사법분야를 예로 들어 보자. 현재 사법개혁이 화두이다. 이를 위하여서는 무엇을 해야 할까? 다른 정책개발은 부수적(?)이다. 쉬운 길이 있다. 바로 사법관련 데이터의 공개이다. 사법관련 모든 자료, 제도, 절차 및 양식 등 그 모든 것이 공개돼야 한다. 그래야 사법당국도 편하다. 또한 이는 사법개혁과 더 나아가 관련 산업의 발전에 절대적인 영향을 미친다. 그런데 사법당국자의 인식은 시대착오적이다. 그중 일부인 판결 등에서도 그대로 드러난다. 그나마 헌법재판소의 경우는 공공데이터 포탈에서 판결 자료 등을 오픈 에이 피 아이로 제공한다. 그런데 대법원은 그렇지 아니하다. 물론 여러가지 이유가 있을 수도 있다. 그러나 이에 대한 인식부족은 분명 있어 보인다. 이에 따라 사법제도 및 관련 미래산업은 필연적으로 어두울 수 밖에 없다.
참고로 미국의 경우는 법원에 제출된 자료는 모두 공공문서로 일반에 공개된다. 다름아닌 공개문서(Public Documentation)이론이다. 이에 따라 구글 등에서 모든 판결문을 쉽게 검색할 수 있다. 이에 따라 사법 관련 데이터 산업 나아가 사법의 디지털화는 가속화될 수 밖에 없다. 또한 이는 인공지능산업의 발전에도 기여하게 된다. 그러나 이런 자료가 일부 당국자만이 독점하고 달리 공중에게 공유되지 아니하는 한 한국은 뒤쳐질 수 밖에 없다. 이런 현실은 안타깝게도 오프라인에서의 사법의 후진성을 가속화하게 될 것이다.
또한 사적 데이터 영역에 있어서도 데이터의 공개. 공유할 수 있는 사회시스템을 구축할 필요가 있다. 전반적인 오픈 데이터 시스템으로 유도할 필요가 있다. 예를 들어 구글 등의 다국적 기업의 경우 한국에서 취득한 정보의 경우에 일정한 규제도 필요하다. 한국에서 얻은 정보는 일정 범위내에서 이를 한국인이나 기업에 공개. 공유될 수 있도록 유도할 필요가 있다. 점진적 법개선사항이다. 외국 기업 뿐만이 아니라 국내기업의 경우에도 마찬가지다. 공중으로부터 얻은 정보는 동일한 맥락에서 일정부분 공유돼야 하기 때문이다 이제 데이터의 생성, 공개. 공유 등이 모든 정책의 핵심사항이 돼야 한다.
다행스럽게 코딩(Coding) 등에 대한 중요성의 인식은 점차 확산되고 있다. 이에 반하여 데이터의 중요성에 대한 인식은 아직도 절대적으로 미흡하다. 인공지능이 중요하다면 다름 아닌 데이터( 가능하면 빅데이터)만을 생각하면 된다. 데이터가 바로 인공지능 그 자체이기 때문이다.